技术背景

当我们尝试运行python的帮助文档时，会看到如下这样的一个说明：

$ python3 -h

usage: python3 [option] ... [-c cmd | -m mod | file | -] [arg] ...

Options and arguments (and corresponding environment variables):

...

-m mod : run library module as a script (terminates option list)

...

这一个条目的意思是，我们可以使用python3 -m这样的指令，在终端的命令行内运行python的一些仓库。比如我们常用的pip，就可以通过python3 -m pip install numpy这样的操作指令来运行。还有一个比较常见的上传python编译安装包到pypi网站上面的工具twine，可以通过python3 -m twine的方法来使用。本文我们主要探讨一下如何在代码中，实现python3 -m 这种命令行运行的模式。

基础功能代码实现

通过python3 -m 这样的方法来运行，本质上只是一个实现方式的改变，而不影响到具体算法的实现，这个形式跟我们直接通过python的API接口去调用是一样的。所以我们需要先按照正常的API接口调用的方法，先把基础代码模块写好。这里我们使用一个开源代码仓库hadder为例，来介绍一下具体的操作方法。我们先看一下Hadder的具体代码架构与相关模块内容：

$ tree hadder/

hadder/

├── examples # 示例

│   ├── case1-complete.pdb

│   ├── case1.pdb

│   ├── case2-complete.pdb

│   ├── case2-complete.png

│   ├── case2.pdb

│   └── case2.png

├── hadder # 根目录

│   ├── constants.py # 存放一些常数

│   ├── __init__.py # 核心算法

│   └── parsers.py # 读取PDB文件

├── LICENSE

├── README.md

├── requirements.txt

└── setup.py

2 directories, 13 files

这里先简单说明一下背景，关于Hadder的具体内容和算法，可以参考这篇博客。Hadder是一个用于给PDB文件补氢原子的小工具，因为在蛋白质折叠的预测过程中，主要以骨架为主，因此氢原子大部分情况下是被忽略的。而在后期建立蛋白质力场的时候，氢原子又是必须使用到的，因此我们可以用hadder这样一个工具来实现补氢的功能。关于hadder我们就不进行更多的介绍了，主要看下其API接口的调用方法：

from hadder import AddHydrogen

AddHydrogen('input.pdb', 'output.pdb')

对外开放的API接口就这么一个，较为简单。接下来我们就可以基于这个功能模块，去创建一个可以通过命令行来运行的方法。

创建main.py文件

当我们使用python3 -m模式来运行的时候，python会去自动索引到__main__.py这个文件作为入口文件，因此首先我们在根目录下创建一个__main__.py文件，如下所示：

$ tree hadder/

hadder/

├── examples # 示例

│   ├── case1-complete.pdb

│   ├── case1.pdb

│   ├── case2-complete.pdb

│   ├── case2-complete.png

│   ├── case2.pdb

│   └── case2.png

├── hadder # 根目录

│   ├── constants.py # 存放一些常数

│   ├── __init__.py # 核心算法

│   ├── __main__.py # python -m 模式运行接口文件

│   └── parsers.py # 读取PDB文件

├── LICENSE

├── README.md

├── requirements.txt

└── setup.py

2 directories, 14 files

然后我们就可以在__main__.py文件中结合argparse来使用，实现一个命令行模式运行的功能，如下是__main__.py文件中的代码内容：

# __main__.py

import argparse

from hadder import AddHydrogen

parser = argparse.ArgumentParser()

parser.add_argument("-i", help="Set the input pdb file path.")

parser.add_argument("-o", help="Set the output pdb file path.")

args = parser.parse_args()

pdb_name = args.i

save_pdb_name = args.o

AddHydrogen(pdb_name, save_pdb_name)

我们还是同样的调用AddHydrogen这个API接口，但是由于使用了argparse，使得我们可以在命令行里面输入相关的输入文件路径和输出文件路径。最终运行效果如下：

$ python3 -m hadder -h

usage: __main__.py [-h] [-i I] [-o O]

optional arguments:

  -h, --help  show this help message and exit

  -i I        Set the input pdb file path.

  -o O        Set the output pdb file path.

$ python3 -m hadder -i input.pdb -o ouput.pdb

1 H-Adding task with 3032 atoms complete in 0.116 seconds.

感兴趣的也可以看看使用这个算法加氢前后的构象区别：

补充

一般我们完成了一个算法实现，需要开放给别人使用的时候。以python为例，最方便的做法是将python仓库编译后上传到pypi网站上面，这样大家可以使用pip来进行安装和管理。这里我们补充一个编译上传python仓库的“三步走”方法：

$ python3 setup.py check

$ python3 setup.py sdist bdist_wheel

$ twine upload --repository-url https://upload.pypi.org/legacy/ dist/*

这样一来，我们就可以通过pip来对我们的仓库进行安装和管理，比如可以使用如下的指令安装hadder：

$ python3 -m pip install hadder --upgrade

总结概要

本文主要通过一个实际的案例，介绍了如何可以在命令行中调用和运行我们的python模块。“python -m”这个方案为我们提供了一个新的选项，这个运行方法以“main.py”文件为入口文件运行，结合python中常用的命令行工具argparse，我们就可以很容易的创建一个可以通过命令行运行和获取参数的python模块。并且可以使用twine上传到pypi网站上，用pip进行安装和管理，会更加的便捷。

版权声明

本文首发链接为：https://www.cnblogs.com/dechinphy/p/pym.html

作者ID：DechinPhy

更多原著文章请参考：https://www.cnblogs.com/dechinphy/

打赏专用链接：https://www.cnblogs.com/dechinphy/gallery/image/379634.html

腾讯云专栏同步：https://cloud.tencent.com/developer/column/91958

CSDN同步链接：https://blog.csdn.net/baidu_37157624?spm=1008.2028.3001.5343

51CTO同步链接：https://blog.51cto.com/u_15561675

以脚本形式运行python库的更多相关文章

shell脚本命令运行python文件&python命令行运行python代码
单独的python文件运行的时候报错: 在shell脚本中,运行shell脚本命令:在Python命令行中,运行Python代码.然而,“python hello.py”是一个脚本命令,不是pyth ...
三种方法运行python
注:本文基于windows 1.交互式解释器配置好环境变量后,命令行中打开,输入python即可,Ctrl+Z退出命令行选项当从命令行启动Python时,可以给解释器一些选项,如下: -d ...
怎样用QtCreator编辑运行python脚本
QtCreator作为一款开发基于qt库的程序.以及开发C语言.c++语言项目都是一个利器,轻便好用.那么作为开发者来说,经常换着使用各种IDE是家常便饭,但是要是这些语言都能够集成到一个工具里岂不是 ...
如何在Windows下开发Python：在cmd下运行Python脚本+如何使用Python Shell（command line模式和GUI模式）+如何使用Python IDE
http://www.crifan.com/how_to_do_python_development_under_windows_environment/ 本文目的希望对于,如何在Windows下, ...
如何在命令行里运行python脚本
python是一款应用非常广泛的脚本程序语言,谷歌公司的网页就是用python编写.python在生物信息.统计.网页制作.计算等多个领域都体现出了强大的功能.python和其他脚本语言如java.R ...
运行python脚本后台执行
最近搞到了一台服务器,挂一个脚本刷刷河畔在线时间.脚本随便写了两下,能跑到什么时候就随缘了 https://blog.csdn.net/philosophyatmath/article/details ...
[SublimeText] Sublime Text 2 运行 Python 脚本中文路径解决方法
在 SublimeText 中直接运行 Python 脚本,出现以下报错提示: Running python -u C:\Documents and Settings\Administrator\桌面 ...
python3：cmd运行python脚本，提示 No module named 'xxx'
问题:cmd窗口运行python脚本,报错 C:\Users\xxx\Documents\GitHub\python3\main>python run_test.pyTraceback (mos ...
Debian9开机运行Python脚本
吾星喵关注 2018.04.14 15:30 字数 214 阅读 202评论 0喜欢 1 Debian9开机运行Python脚本 Debian 9.x "stretch" 解决 ...

随机推荐

Java中日期格式化的实现算法
package com.study.test; import java.io.Serializable; import java.text.SimpleDateFormat; import java. ...
JVM内存管理面试常见问题全解
目录一.什么是JVM 1.jvm的三个组成部分二.类加载系统 1.类的加载过程 2.类加载器三.双亲委派机制 1.双亲委派机制介绍 2.为什么要双亲委派机制 3.双亲委派机制的核心源码 4.全盘 ...
UML 类之间的关系
统一建模语言(Unified Modeling Language,UML) 作用:对软件系统进行说明如果说软件系统是一本小说的话,那么 UML 就是将小说动漫化. 也许你看过这本小说,但是时间一长, ...
深度长文：深入理解Ceph存储架构
点击上方"开源Linux",选择"设为星标" 回复"学习"获取独家整理的学习资料! 本文是一篇Ceph存储架构技术文章,内容深入到每个存储特 ...
C#开发PACS医学影像三维重建(十三):基于人体CT值从皮肤渐变到骨骼的梯度透明思路
当我们将CT切片重建为三维体之后,通常会消除一些不必要的外部组织来观察内部病灶, 一般思路是根据人体常见CT值范围来使得部分组织透明来达到效果, 但这是非黑即白的,即,要么显示皮肤,要么显示神经,要么 ...
Json序列化与反序列化导致多线程运行速度和单线程运行速度一致问题
紧跟上篇文章十个进程开启十个bash后一致写入命令执行完毕之后产生了很多很多的文件,博主需要对这些文件同意处理,也就是说对几十万个文件进行处理,想了又想,单线程处理那么多数据肯定不行,于是乎想到了使 ...
spring4+hibernate4 整合
1.web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app version=" ...
opencv学习之基础
前段时间一直在钻研深度学习中的卷积神经网络,其中的预处理环节可以说非常关键,主要就是对图片和视频进行处理.而图像处理就涉及到图形学和底层技术细节,这是一个比较精深和专业的领域,假设我们要从头开始做起, ...
docker+nginx+redis部署前后端分离项目！！！
介绍本文用的经典的前后端分离开源项目.项目的拉取这些在另一篇博客!!! 其中所需要的前后端打包本篇就不做操作了!!不明白的去看另一篇博客!!! 地址:http://www.cnblogs.com/ps ...
为什么列式存储会被广泛用在 OLAP 中？
大家好,我是大D. 不知是否有小伙伴们疑问,为什么列式存储会广泛地应用在 OLAP 领域,和行式存储相比,它的优势在哪里?今天我们一起来对比下这两种存储方式的差别. 其实,列式存储并不是一项新技术,最 ...

以脚本形式运行python库