本篇为<Python数据可视化实战>第十篇文章,我们一起学习一个交互式可视化Python库--Bokeh. Bokeh基础 Bokeh是一个专门针对Web浏览器的呈现功能的交互式可视化Python库.这是Bokeh与其它可视化库最核心的区别. Bokeh绘图步骤 ①获取数据 ②构建画布figure() ③添加图层,绘图line,circle,square,scatter,multi_line等:参数co lor,legend ④自定义视觉属性 ⑤选择性展示折线数据,建立复选框激活显示,复选框(…
如果你是一名数据科学家或数据分析师,或者只是对这一行业感兴趣,那下文中这些广受欢迎且非常实用的Python库你一定得知道. 从数据收集.清理转化,到数据可视化.图像识别和网页相关,这15个Python库涵盖广泛,本文将对它们进行简介. 想必其中一些你已经熟知,但如果有不知道的,强烈建议你一定要好好了解一下. 数据收集 大部分数据分析项目都始于数据收集和提取.在一些情况下,当为公司处理现存问题时,公司可能会提供相关的数据组.但有些时候,可能并没有现成的数据,需要数据工程师自行收集.最常见的情况就是…
Arrow是一个处理时间的python库,能一键转换dates/times/timestamps等时间格式而不需要大量导致各种时间模块和格式转换函数,十分快捷方便 使用Arrow需要两步转换操作: 1.接收各种类型的时间datetimes/date/timestamp转换为Arrow类型 2.转换为自己需要的格式或者操作 import arrow # 获取当前时间的Arrow格式 a = arrow.now() print(a) # 2018-03-08T23:21:21.981044+08:0…
1. TPOT介绍 一般来讲,创建一个机器学习模型需要经历以下几步: 数据预处理 特征工程 模型选择 超参数调整 模型保存 本文介绍一个基于遗传算法的快速模型选择及调参的方法,TPOT:一种基于Python的自动机器学习开发工具.项目源代码位于:https://github.com/EpistasisLab/tpot 下图是一个机器学习模型开发图,其中灰色部分代表TPOT将要做的事情:即通过利用遗传算法,分析数千种可能的组合,为模型.参数找到最佳的组合,从而自动化机器学习中的模型选择及调参部分.…
开源机器学习库介绍 MLlib in Apache Spark:Spark下的分布式机器学习库.官网 scikit-learn:基于SciPy的机器学习模块.官网 LibRec:一个专注于推荐算法的java开源库.官网 BigML:连接外部服务器的库.官网 Caffe:考虑了代码清洁.可读性及速度的深度学习框架.官网 TensorFlow:该系统旨在促进对机器学习的研究,同时也让机器学习研究原型过渡到生产系统更加高效容易.官网 解决特定问题的工具 LIBLINEAR  官网  台大出品 LIBS…
机器学习令人无比神往,但从事这个工作的人可能并不这么想. 机器学习的工作内容往往复杂枯燥又困难——通过大量重复工作进行提升必不可少: 汇总工作流及传输渠道.设置数据源以及在内部部署和云部署的资源之间来回分流. 所以使用工具提升你的工作效率实在很关键,而且像这样的工具越多越好. 好在你学的是Python,作为一门威力巨大的工具语言,Python可以给你提供足够的辅助工具,让你在大数据和机器学习项目中游刃有余. 唯一的问题在于Python海量的资源库让患有选择困难症的你难以取舍,因此糖豆贴心的给你找…
引言     最近有些朋友总来问我有关遗传算法的东西,我是在大学搞数学建模的时候接触过一些最优化和进化算法方面的东西,以前也写过几篇博客记录过,比如遗传算法的C语言实现(一):以非线性函数求极值为例和C语言实现粒子群算法(PSO)一等,如果对原理有兴趣的话可以去我的博客具体查看:Lyrichu's Blog.所以突发奇想,干脆把以前写的一些进化算法比如遗传算法(GA),粒子群算法(PSO),模拟退火算法(SA)以及最近看的基于梯度的一些优化算法比如Gradient Descent,SGD,Mom…
NumPy NumPy(数值 Python 的简称)是其中一个顶级数据科学库,它拥有许多有用的资源,从而帮助数据科学家把 Python 变成一个强大的科学分析和建模工具.NumPy 是在 BSD 许可证的许可下开源的,它是在科学计算中执行任务的基础 Python 库.SciPy 是一个更大的基于 Python 生态系统的开源工具,而 NumPy 是 SciPy 非常重要的一部分. NumPy 为 Python 提供了大量数据结构,从而能够轻松地执行多维数组和矩阵运算.除了用于求解线性代数方程和其…
在Python的世界里,将一个对象以json格式进行序列化或反序列化一直是一个问题.Python标准库里面提供了json序列化的工具,我们可以简单的用json.dumps来将一个对象序列化.但是这种序列化仅支持python内置的基本类型,对于自定义的类,我们将得到Object of type A is not JSON serializable的错误. 有很多种方法可以用来支持这种序列化,这里有一个很长的关于这个问题的讨论.总结起来,基本上有两种还不错的思路: 利用标准库的接口:从python标…
你好,我是悦创.之前我在 CSDN 编写了一篇开发 Python 库的教程,有人加我提问到的一些问题,我来更新一下这篇文章:https://blog.csdn.net/qq_33254766/article/details/119874997 新版文章首发:https://bornforthis.cn/posts/18.html 你好,我是悦创. Hello, I'm Yue Chuang. 我最近想要去开始开发 Python 第三方库,但是发现国内这样的教程太少了,所以就我来写吧! I rec…