使用pybind11为Python编写C++扩展(一)配置篇:Build(编译和链接)
最后决定选用pybind11,理由如下:
- 比python原生的C API看起来人性多了
- 我的C++代码不是现成的,需要一定的C++开发工作量,所以感觉cython不是很方便。如果C++接口已经给好了,只需要简单包装一下,Cython可能更好。
- pybind11声称只包含头文件,且能通过pip安装,感觉比boost_python轻量且最后这个扩展包容易分发。此外,感觉它的文档也比boost python友好不少……
Setuptools
这种方式适合python包的构建、打包、分发、上传到PyPi一条龙服务。python使用C++扩展需要在setup.py里配置好Extension。以下是一个setup.py的样例:
import glob
import os.path
from distutils.core import setup
__version__ = "0.0.1"
# make sure the working directory is BASE_DIR
BASE_DIR = os.path.dirname(__file__)
os.chdir(BASE_DIR)
ext_modules = []
try:
from pybind11.setup_helpers import Pybind11Extension, ParallelCompile, naive_recompile
# `N` is to set the bumer of threads
# `naive_recompile` makes it recompile only if the source file changes. It does not check header files!
ParallelCompile("NPY_NUM_BUILD_JOBS", needs_recompile=naive_recompile, default=4).install()
# could only be relative paths, otherwise the `build` command would fail if you use a MANIFEST.in to distribute your package
# only source files (.cpp, .c, .cc) are needed
source_files = glob.glob('source/path/*.cpp', recursive=True)
# If any libraries are used, e.g. libabc.so
include_dirs = ["INCLUDE_DIR"]
library_dirs = ["LINK_DIR"]
# (optional) if the library is not in the dir like `/usr/lib/`
# either to add its dir to `runtime_library_dirs` or to the env variable "LD_LIBRARY_PATH"
# MUST be absolute path
runtime_library_dirs = [os.path.abspath("LINK_DIR")]
libraries = ["abc"]
ext_modules = [
Pybind11Extension(
"package.this_package", # depends on the structure of your package
source_files,
# Example: passing in the version to the compiled code
define_macros=[('VERSION_INFO', __version__)],
include_dirs=include_dirs,
library_dirs=library_dirs,
runtime_library_dirs=runtime_library_dirs,
libraries=libraries,
cxx_std=14,
language='c++'
),
]
except ImportError:
pass
setup(
name='project_name', # used by `pip install`
version='0.0.1',
description='xxx',
ext_modules=ext_modules,
packages=['package'], # the directory would be installed to site-packages
setup_requires=["pybind11"],
install_requires=["pybind11"],
python_requires='>=3.8',
include_package_data=True,
zip_safe=False,
)
一些需要注意的点(坑):
如果需要通过sdist(即
.tar.gz的源码方式)发布包的话,Extension的source_files字段必须是相对路径。否则build的时候会因为egg-info里的SOURCE.txt里有绝对路径而报错。但由此带来的问题是我们不能确定跑setup.py的时候工作目录是啥,为了保险起见,需要把它设置成setup.py所在的目录。在安装包之前,为了获取一些metadata,setuptools会先跑一次
setup.py,这个时候如果没有装pybind11,会报错。为了解决这个问题:- 为了能正常执行到
setup函数,我们需要先保证没有pybind11的情况下执行这个文件也不会报错。所以我们需要把所有依赖pybind11.setup_helpers的部分都放到try里。也有其它的方法,比如直接复制一个setup_helpers啥的,具体可以看文档。
- 根据setuptools的文档,
setup_requires并不会安装包,所以pybind11也需要加到install_requires里。 - 最后,在安装本包前,setuptools会先安装依赖项,然后再跑
setup.py install,这时就可以成功build和安装了。
- 为了能正常执行到
如果你的外接库不在系统查找动态库的指定路径里,那么指定link_dirs之后,编译和链接不会出错。但执行的时候还是会因为找不到动态库而报错。可以通过添加
runtime_library_dirs(等价于-Wl,-rpath),或者给LD_LIBRARY_PATH环境变量里添加这个路径。编译后的
.so的位置,以及你的C++ module在python里的名字,取决于你给Extension写的名字。例如,你希望文件结构是这样:project_dir
|-- package
| |-- __init__.py
| |-- this_package.xxxx.so
| |-- other.py
|-- setup.py
这样你最后在
site-packages里只会新建一个包叫package。此外,哪怕你这个project只想导出一个
.so里的模块,把它放到一个文件夹里包装起来也会更好。因为如果你只想导出一个this_package,把setup函数里的配置改成了packages=['this_package'],这个.so文件会直接被加到site-packages,感觉不是很优雅。这时候你的
Extension的名字就需要是package.this_package。这样.so的位置就是对的,你运行import package.this_package就会正确地找到.so并执行了。
但是,要保证执行.so不出错,在C++里通过PYBIND11_MODULE把这个扩展expose到python里的时候,名字也要对应:PYBIND11_MODULE(_pynodejs, m) {}
CMake
参考官方的CMake构建文档。
如果是编译嵌入python的C++程序,可以用CMake,比较方便。
虽然python extension似乎也可以用CMake,但是还是setuptools比较方便。
我这里主要是用CMake编译C++部分的测试。CMakeLists.txt大概长这样:
# the CMakeList to test the C++ part from a C entry point
cmake_minimum_required(VERSION 3.21)
project(project_name)
set(CMAKE_CXX_STANDARD 14)
# Find pybind11
find_package(pybind11 REQUIRED)
# If any library (e.g. libabc.so) is needed
include_directories(INCLUDE_DIR)
link_directories(LINK_DIR)
# Add source file
file(GLOB A_NAME_FOR_SOURCE CONFIGURE_DEPENDS "source/path/*.cpp")
file(GLOB A_NAME_FOR_TEST CONFIGURE_DEPENDS "test/path/*.cpp")
add_executable(TARGET_NAME test_cpp_part.cpp ${A_NAME_FOR_SOURCE} ${A_NAME_FOR_TEST})
target_link_libraries(TARGET_NAME abc pybind11::embed)
project_name随便写TARGET_NAME随便写,只要add_executable和target_link_libraries对应就行,是最后的可执行文件的名字A_NAME_FOR_SOURCE和A_NAME_FOR_TEST是一个CMake的中间变量名,随便写,它们分别代表了GLOB找到的一堆源文件,和用于测试的一堆文件INCLUDE_DIR里是库abc的头文件,LINK_DIR里必须包含库文件,动态库类似libabc.so,静态库类似libabc.a。- Link到
pybind11::embed的原因是防止带python对象的那部分C++代码编译失败。
使用pybind11为Python编写C++扩展(一)配置篇:Build(编译和链接)的更多相关文章
- 最全总结 | 聊聊 Python 数据处理全家桶(配置篇)
1.前言 在实际项目中,经常会接触到各种各样的配置文件,它可以增强项目的可维护性 常用配件文件的处理方式,包含:JSON.ini / config.YAML.XML 等 本篇文章,我们将聊聊 Pyth ...
- Python和C扩展实现方法
一.Python和C扩展 cPython是C编写的,python的扩展可以用C来写,也便于移植到C++. 编写的Python扩展,需要编译成一个.so的共享库. Python程序中. 官方文档:htt ...
- python编写shell脚本详细讲解
python编写shell脚本详细讲解 那,python可以做shell脚本吗? 首先介绍一个函数: os.system(command) 这个函数可以调用shell运行命令行command并且返回它 ...
- 用Python编写一个简单的Http Server
用Python编写一个简单的Http Server Python内置了支持HTTP协议的模块,我们可以用来开发单机版功能较少的Web服务器.Python支持该功能的实现模块是BaseFTTPServe ...
- 为Python编写一个简单的C语言扩展模块
最近在看pytorh方面的东西,不得不承认现在这个东西比较火,有些小好奇,下载了代码发现其中计算部分基本都是C++写的,这真是要我对这个所谓Python语音编写的框架或者说是库感觉到一丢丢的小失落,细 ...
- python使用C扩展
CPython还为开发者实现了一个有趣的特性,使用Python可以轻松调用C代码 开发者有三种方法可以在自己的Python代码中来调用C编写的函数-ctypes,SWIG,Python/C API.每 ...
- 使用由 Python 编写的 lxml 实现高性能 XML 解析
lxml 简介 Python 从来不出现 XML 库短缺的情况.从 2.0 版本开始,它就附带了 xml.dom.minidom 和相关的 pulldom 以及 Simple API for XML ...
- 基于python编写的天气抓取程序
以前一直使用中国天气网的天气预报组件都挺好,可是自从他们升级组件后数据加载变得非常不稳定,因为JS的阻塞常常导致网站打开速度很慢.为了解决这个问题决定现学现用python编写一个抓取程序,每天定时抓取 ...
- 用Python编写博客导出工具
用Python编写博客导出工具 罗朝辉 (http://kesalin.github.io/) CC 许可,转载请注明出处 写在前面的话 我在 github 上用 octopress 搭建了个人博 ...
随机推荐
- BL8810|USB 2.0单芯片解决方案闪存读卡器|BL8810替代GL823K
创惟GL823K是一款USB 2.0单LUN读卡器控制器,可支持SD/MMC/MSPRO闪存卡.它支持USB 2.0高速传输,将Digital TM(SD).SDHC.SDXC.Mini DTM.Mi ...
- gojs 实用高级用法
大家,新年好! 历史文章: 数据可视化 gojs 简单使用介绍 gojs 如何实现虚线(蚂蚁线)动画? 本文介绍的是在使用 gojs 制作图的过程中,你可能会碰到的问题的一些解决方案. gojs 是一 ...
- CSS3的nth-child() 选择器,表格奇偶行变色
nth-child() 应用背景 CSS3的nth-child() 选择器,我之前很少用,在做表格偶数行变色的时候,我通常在绑定的时候,做一个js判断,来加一个css,从而使表格偶数行和奇数行颜色不一 ...
- [学习笔记] Oracle基础增删改查用法
查询 select *|列名|表达式 from 表名 where 条件 order by 列名 select t.* from STUDENT.STUINFO t where t.stuname = ...
- nginx及依赖包安装分享 百度网盘(pcre+openssl+zlib)
链接:https://pan.baidu.com/s/1gggq1p-uZSmAw49o5xfl4g 提取码:ypoj 复制这段内容后打开百度网盘手机App,操作更方便哦 1.安装pcre 解压:ta ...
- 初识python: 生成器
生成器定义理解,直接上代码: #!/user/bin env python # author:Simple-Sir # time:20181005 # 生成器 ''' # 列表生成式 a=[i for ...
- 学习git&github
详细学习视频: 链接:https://pan.baidu.com/s/1Vub3YTo7uUUuGCJUCabBRQ 提取码:6q9x 一.git基本工作流程 我们先来理解下Git 工作区.暂存区和版 ...
- Flask_路由(二)
一.路由规则设置说明 flask框架使用route()装饰器配置路由. from flask import Flask app = Flask(__name__) @app.route("/ ...
- linux安全篇:禁止频繁访问的ip访问nginx
实验环境 版本:redhat6.5ip:172.16.1.100,172.16.10软件:nginx 172.16.1.10部署nginx [root@localhost tools]# lsngin ...
- Mysql设计遵循规则
为什么要优化系统的吞吐量瓶颈往往出现在数据库的访问速度上随着应用程序的运行,数据库的中的数据会越来越多,处理时间会相应变慢数据是存放在磁盘上的,读写速度无法和内存相比 如何优化设计数据库时:数据库表. ...