【导语】Python 里各种丰富的标准库、第三方库和模块成为其广受欢迎的原因之一。而 PyPI 就是大家想第三方库前先要安装的一个仓库。作为使用者,它可以帮我们查找 Python 社区开发和共享的软件;而作为开发者,可以用 PyPI 分发自己的软件。从 2003 年创建 PyPI 到现在,整个社区又是如何发展的?现状如何?有哪些有趣的发现,本文将与大家一起进行初步探索。

构建 PyPI 镜像一件非常酷的事情就是让我掌握了很多的数据。至此,我决定探索一下自 2003 年创建 PyPI 以来,整个生态系统发生了怎样的变化。不过,接下来大部分的分析都是始于 2005 年,这一年 PyPI 添加了 upload_time 。

下图展示了2005-2018 年活跃的 Python Packages 数量,蓝色表示 Old Packages,橙色表示 New。

在这十四年间,Python 的生态系统一直在稳步增长。随着 PyPI 在 Python 社区几乎被完全接受,在那几年里持高速增长。之后活跃 Packages 的数量每年增长 28% 到 48%(活跃 Packages 指的是已经发布过一版或发布了新版本)。

在这14年的时间里,Python的生态系统一直在稳步增长。对于PyPl而言,在它被Python社区几乎完全接受的那几年里持高速增长状态, Packages (至少更新过一个版本或刚刚上线的)数量也在活跃增长,年复合增长率可达28%至48%。

如图所示,66%的Packages是新发布的,其中绝大多数不会持续维护;持续一年以上维护的Packages还是保持强劲增长;每年新上线的Packages增幅在31%~59%,尽管增速有所减缓,但势头不减。这意味着,整体上看,Packages正发布着越来越多的版本,预示着PyPl变得越来越成熟。

结果最令我吃惊的是,每个Packages的发布数量。此前我一直靠个人经验,升级Packages依赖库,例如 AWS 的 #15 botocore,但是 ccxt 库 的“脱颖而出”是我没想到的。在不到两年的时间里,ccxt 已经发布了 4659 个版本,发布数量比其他的 Packages 的 3 倍还多。但是当我在尝试加载它的时候, libraries.io 页面的加载时间要 30 多秒,所以,我也不确定它的维护是好还是坏,但是真的是让人印象非常深刻!

另外一个有趣的发现是分发 Packages实践上的变化。最大的变化是 Python 3 的发布。Binary Wheels 于 2012 年被引入并编入 PEP 427,被普遍认为是分发 Python Packages 的最佳方式,但 Packages 作者的接受周期还需要时间。Python Wheels 可以跟踪 PyPI 360 个 Packages 的采用情况,如下图:

(图片来源:https://pythonwheels.com/

并不是每个 Packages 都将作为 wheel 发布,特别是 psycopg2 马上就要停止发布了,其捆绑的 LibSSL 和系统自带的 LibSSL 间有冲突,不过这种情况并不常见,所以希望未来可以有更多的 Packages 被作为 wheel 分发,保持现在的强劲势头,可以达到 90% 乃至更多。如果按照下面图中趋势的发展,也许 2022 年就可以实现了。

简说Python生态系统的14年演变的更多相关文章

  1. 简学Python第二章__巧学数据结构文件操作

    #cnblogs_post_body h2 { background: linear-gradient(to bottom, #18c0ff 0%,#0c7eff 100%); color: #fff ...

  2. 简说Python发展及其就业前景

    简说python 发展历史 Python是著名的"龟叔"Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言. python从ABC语言 ...

  3. 简说Python之Jupyter Notebook

    目录 简说Python之Jupyter Notebook 1.Jupyter Notebook 系统环境:Ubuntu 18.04.1 LTS Python使用的是虚拟环境:virutalenv Py ...

  4. 【简说Python WEB】Flask-Moment

    目录 [简说Python WEB]Flask-Moment 系统环境:Ubuntu 18.04.1 LTS Python使用的是虚拟环境:virutalenv Python的版本:Python 3.6 ...

  5. 【简说Python WEB】视图函数操作数据库

    目录 [简说Python WEB]视图函数操作数据库 系统环境:Ubuntu 18.04.1 LTS Python使用的是虚拟环境:virutalenv Python的版本:Python 3.6.9 ...

  6. 【简说Python WEB】Flask应用的文件结构

    目录 [简说Python WEB]Flask应用的文件结构 1.文件结构的目录 2.配置程序--config.py 3.app应用包 4.剥离出来的email.py 5.蓝本(BLueprint)的应 ...

  7. 【简说Python WEB】数据库

    目录 [简说Python WEB]数据库 数据库表 docker安装MySQL Flask-SQLAlchemy操纵MySQL数据库 初始化 定义模型 定义关系 数据库的CRUD操作 创建表 inse ...

  8. 【简说Python WEB】Web应用部署

    目录 [简说Python WEB]Web应用部署 应用层 缓存层 数据层 Gunicorn 的应用 1.安装Gunicorn 2.Gunicorn的启动 Nginx 的应用 1.docker方式部署安 ...

  9. Python学习总结14:时间模块datetime & time & calendar (一)

    Python中的常用于处理时间主要有3个模块datetime模块.time模块和calendar模块. 一.time模块 1. 在Python中表示时间的方式 1)时间戳(timestamp):通常来 ...

随机推荐

  1. DSAPI 生成桌面图标(带数字)

    功能:在桌面上创建一个带有指定数字的图标. 效果图: 生成的ICO图标 代码 Private Sub 生成桌面图标(消息数量 As Integer) Try Dim B As New Bitmap(M ...

  2. ORM之轻量级框架--Dapper

    一.什么是Dapper? Dapper是一款轻量级Orm框架,它是属于半自动的,它和Entity Framework和NHibernate不同,它只有一个单文件,没有很复杂的配置,如果你喜欢原生Sql ...

  3. HTML/CSS初步了解

    一.CSS是什么? 它是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言.CSS为HTML标记语言提供了一种样式描述,定义了其中元素的显示 ...

  4. 全球第一免费开源ERP Odoo工业互联网生产制造功能模块术语解析

    物料清单 物料清单(BoM)用于描述物料.每种物料的数量.以及制造某一产品所需的步骤.由于行业和成品性质的不同,同一个文件可能有不同的命名.例如,在制药行业中,可以使用术语“处方”. 周期 产品周期是 ...

  5. Windows Server 2016 安装虚拟机版黑群晖

    硬件配置 Dell R730 CPU: Intel(R) Xeon(R) CPU E5-2603 v4 @1.70GHz(6 cores) Ram: 16Gb HDD: 系统-600GB SAS X2 ...

  6. SQL server 存储过程的建立和调用

     存储过程的建立和调用 --1.1准备测试需要的数据库:test,数据表:物料表,采购表if not exists (select * from master.dbo.sysdatabases whe ...

  7. JetBrains 系列编译器 破解(idea,webstrom ,pycharm等)

    第一步: 下载安装好Idea 或者Pychar ,安装好后不可运行 第二步: 安装完成之后不要立即运行,以下提供JetbrainsCrack的jar包来破解: jar包资源自行百度 下载之后,把Jet ...

  8. 解决ASP.NET Core MVC调试慢的问题

    最近在做的一个项目中,发现网页端同时发起了4个AJAX请求需要数秒才获取到响应,太慢了,当我把请求数降低为1个的时候,速度看起来就比较正常,增加到2个同时的请求后,速度就有些慢了,3个的话就明显慢了, ...

  9. 关于单元测试的思考--Asp.Net Core单元测试最佳实践

    在我们码字过程中,单元测试是必不可少的.但在从业过程中,很多开发者却对单元测试望而却步.有些时候并不是不想写,而是常常会碰到下面这些问题,让开发者放下了码字的脚步: 这个类初始数据太麻烦,你看:new ...

  10. kafka的设计

    1.动机 设计 kafka 初衷,作为统一平台处理大公司的实时数据.所以 必须具有如下特性: 支持海量数据 高吞吐量 低延迟(实时性) 支持分区,分布式 容错 2.持久化 kafka 高度依赖 文件系 ...