解密:Python风靡全宇宙,首要原因竟是它?
就让我们从近年来大数据的兴起说起,为你娓娓道来Python火爆的真正原因。
郁闷的大数据程序员
随着大数据的崛起,大多数行业发现自己进入了一种恐慌状态:他们花费了大量的时间和金钱来建立他们的大数据渠道,但是他们的投资回报率却很低。在毫无喘息机会的竞争中,虽然能够挖取到日益增长的数据,但大多数公司并没有一个明确的计划来处理他们挖取到的数据。当时,几乎每个人都认为,有了大量的数据存储,后面的分析就会变得更简单,数据的业务价值也会变得显而易见。这在今天听起来可能很愚蠢,但大多数人依旧认为,只要获取到足够的数据,数据背后的规律和信息就会自动浮现。
被时代召唤的“数据科学家”
随后,业界几乎同时觉醒,他们希望得到的各种卓越远见和希望回答的问题都需要严格的数学分析和验证。 SQL查询能让你知道数据最明显的模式和趋势,但要想获取数据中最为有用的信息,你需要的其实是完全不同的另一套技术——一套牢固扎根于数学和应用数学的技能。而具备这种技术的人才似乎只存在于学术界中。此外,负责分析这些庞大数据集的人不仅需要非常强大的数学背景,还需要能够编写软件。这也不难解释为什么“数据科学家”这一职位频繁出现在招聘网站上了。
Ruby与Python的“Web开发语言之争”
我们再往回讲讲,在大数据还没有真正风靡之前,Ruby和Python曾在成为最受欢迎的“web开发语言”上发生过激烈的争战。 两者都非常适合开发Web应用程序。 Ruby的受欢迎程度与Rails框架密切相关。 在那个年代,大多数自称为“Ruby程序员”其实更应该称自己为 “Rails程序员”。 而Python在学术界和少数不同行业已经相当完善。 在Python中,与Rails最相近的是Django,Django尽管在Rails之前发布,但它的受欢迎程度似乎远远落后于Rails。
很多人认为,Python和Ruby的性能都很相似,最终只会有一种语言能够赢得“web开发语言之战”。 但实际上,Ruby的流行度与Rails密切相关,而Django只代表了一个已经很活跃的Python生态系统的一小部分。事实也证明,“Web开发语言之战”的重要性远低于人们的预期。即便从很多层面来讲,Ruby都凭借Rails赢得了这场争战,但这丝毫不影响Python成为当今最受欢迎的语言。这到底是为什么呢?
Oliphant的大手笔
为了揭开这个谜团,我们就不得不提一下一位大佬了,他就是Travis Oliphant。追溯到2006年。当时,Travis Oliphant还是BYU的助理教授,他仍未创办Anaconda(注:Anaconda是一个完全以Python为基础的,目前最成功的商业数据科学平台之一)。 一年前,他参考科学计算库Numeric开发了NumPy。 他后来又成为SciPy的创始人并兼任了PSF的主管。
在2006年,他与Carl Banks一起提交了PEP 3118,这是Python的“缓冲区协议”的修订版。这为Python的兴起埋下了重要伏笔。
Python的缓冲协议:Python风靡全球的首要原因
缓冲器协议是(并且仍然是)一个极低级别的API,被其他库用来直接操纵内存缓冲区。 这些是由解释器创建和使用的缓冲器,用于存储连续存储器中某些类型的数据(最初,主要是“类似数组的”数据类型和大小都被提前给出的数据结构)。
提供这样一个API的主要动机是:消除在只读取时复制数据的必要性,澄清缓冲区的所有权转移语意,并将数据存储在连续的存储器中(即使在多维数据结构的情况下),其中读取访问速度非常快。 那些将使用该API的“其他库”一般都是用C写的,而且对性能十分敏感。 这一新协议意味着,如果我创建了一个NumPy的int数组,其他库可以直接访问底层内存缓冲区,而不是间接访问或者在使用该数据之前复制该数据。
现在问题来了:什么类型的程序员会从快速、零拷贝的大量数据获取中受益呢?
当然是数据科学家了!
让我们们来梳理一下事件的发展过程:
Oliphant和Banks提出了Python的缓冲协议的修订,以简化对刚开始的NumPy项目工作所驱动的某些数据结构的底层内存的直接访问。
PEP 3118(https://www.python.org/dev/peps/pep-3118/) 提交,被认可,实施。
受益于PEP 3118的实现,Python已悄然成为一个非常吸引人的编译语言。在此基础上,就有了很多基于C语言扩展的数字计算库被开发出来(注:C语言扩展可以很便捷地实现数据共享和操作。)
Python和Ruby在网络上一决雌雄,大多数人认为“Web开发语言之战”必有分晓。
随着磁存储设备价格暴跌,存储大量数据以供日后分析变得可行(因为数据已经变得很廉价,最好是先把数据保存起来,甚至都不需要去考虑具体要分析什么。)
对新一代程序员的需求发生变化:具有统计学背景,最好还得有应用数学背景的,且先前有过一些编程经验的程序员开始被哄抢——数据科学家的时代来临了!
数据科学家们想寻找一种既具有表现力又快速的语言(具有良好的数值计算库支持启动),所有的这些需求都指向于Python
后来,就如我们看到的那样,Python受到万千宠爱,一跃成为了最受欢迎的编程语言。
文摘菌今天对Python的揭秘就到此为止了~
读到这儿,如果你已经是一个Python粉,赶紧偷偷开心一下,自己对Python大法有了更深刻的了解。
如果你想成为一名数据科学家,但还没入Python的坑,现在是不是也已经蠢蠢欲动了呢?
欢迎加入Python学习群:725479218,群文件有大量学习书籍、文件,还有技术人员提供答疑

解密:Python风靡全宇宙,首要原因竟是它?的更多相关文章
- python no module named _socket 原因
python no module named _socket 原因 Lib/site-packages 不在 sys.path 中
- Linux系统下为何病毒少?原因竟是这个?
Linux系统下为何病毒少?原因竟是这个? 可能不少人持这样一种观点,认为 Linux 病毒少是因为Linux不像Windows那么普及,其实这种观点很早已经被人批驳过了,一个最有力的论据是:如果写病 ...
- DeBug Python代码全靠print函数?换用这个一天2K+Star的工具吧,改进版
pysnooper是代码debug神器,比无限low print好很多和也比日志debug好一些,比断点调试也好一些,这个很犀利的装饰器. https://www.toutiao.com/a66829 ...
- 100万套PPT模板,包含全宇宙所有主题类型PPT,绕宇宙100圈,持续更新
100万套PPT模板,包含全宇宙所有主题类型PPT(全部免费,都是精品,没有一张垃圾不好看的PPT,任何一张PPT拿来套入自己的信息就可以立马使用),绕宇宙100圈,任意一个模板在某文库上都价不菲.强 ...
- 老男孩Python高级全栈开发工程师三期完整无加密带课件(共104天)
点击了解更多Python课程>>> 老男孩Python高级全栈开发工程师三期完整无加密带课件(共104天) 课程大纲 1.这一期比之前的Python培新课程增加了很多干货:Linux ...
- 老男孩Python高级全栈开发工程师【真正的全套完整无加密】
点击了解更多Python课程>>> 老男孩Python高级全栈开发工程师[真正的全套完整无加密] 课程大纲 老男孩python全栈,Python 全栈,Python教程,Django ...
- kubectl get 后按2次tab键命令补全的失效原因分析
kubectl get 后按2次tab键命令补全的失效原因分析 2019/10/28 Chenxin a.bash客户端工具 在centos用户下, cd ~;echo "source &l ...
- Python 自动化测试全攻略:五种自动化测试模型实战详解
随着移动互联网的发展,软件研发模型逐步完善,软件交付质量越来越受到软件公司的重视,软件测试技术特别是自动化测试技术开始在软件系统研发过程中发挥着越来越重要的作用. 与传统的手工测试技术相比,自动化测试 ...
- 测开之Python自动化全栈工程师+性能专项(送思维导图)
测开之Python自动化全栈工程师+性能专项 功能测试基础 接口测试基础接口的通信原理与本质cookie.session.token详解接口测试的意义与测试方法接口测试用例的设计 app测试 app流 ...
随机推荐
- JS 数组位置方法 indexOf()和lastIndexOf()的理解
var numbers = [1,3,5,7,9,4,3,2,1]; console.log(numbers.indexOf(5)); //从数组的0位开始查找 5 位于数组里面的位置 输出2 首先 ...
- Runtime和Process
private void runByshcommand(String command) { try { System.out.println("开始执行命令....."); Pro ...
- python之MRO和C3算法
python2类和python3类的区别pyhon2中才分新式类与经典类,python3中统一都是新式类Python 2.x中默认都是经典类,只有显式继承了object才是新式类python 3.x中 ...
- Postgresql_根据执行计划优化SQL
执行计划路径选择 postgresql查询规划过程中,查询请求的不同执行方案是通过建立不同的路径来表达的,在生成许多符合条件的路径之后,要从中选择出代价最小的路径,把它转化为一个计划,传递给执行器执行 ...
- EntityFramework Code-First 简易教程(四)-------继承策略
在前篇CodeFirst类型约定中,我们在数据库中为每一个模型类创建一个表,但是有个问题,我们可以设计出带继承关系的模型类,即面向对象编程既有“has a”(表示类继承)也有“is a”(表示类包含) ...
- Linux 查看本机串口方法
最近在了解嵌入式方面的知识,就随笔记录一下: 查看Linux本机串口: 1.查看串口是否可用 可以对串口发送数据比如对com1口,echo /dev/ttyS02.查看串口名称使用 ls -l /de ...
- mysql字符串查询常用命令
对于针对字符串位置的操作,第一个位置被标记为1. ASCII(str) 返回字符串str的最左面字符的ASCII代码值.如果str是空字符串,返回0.如果str是NULL,返回NULL. mysql' ...
- Properties集合_练习
定义功能:获取一个应用程序 运行次数,如果超过5次,给出使用次数已到请注册的提示,并不要再运行程序 思路: 1.定义计数器:每次程序启动都需要计数一次,并且是在原有的次数上进行计数. 2.计数器就 ...
- 美人鱼 hdu 5784
Peter has a sequence a1,a2,...,ana1,a2,...,an and he define a function on the sequence -- F(a1,a2,.. ...
- vs2015添加管理员权限
在工作过程中,我可能可能遇到要求编译好的程序默认以管理员权限运行,我们可以这样操作 一.新建一个manifest文件: <?xml version="1.0" encodin ...