原文链接:https://junjiecai.github.io/posts/2016/Oct/20/none_vs_nan/ 建议从这里下载这篇文章对应的.ipynb文件和相关资源.这样你就能在Jupyter中边阅读,边测试文中的代码. python原生的None和pandas, numpy中的numpy.NaN尽管在功能上都是用来标示空缺数据.但它们的行为在很多场景下确有一些相当大的差异.由于不熟悉这些差异,曾经给我的工作带来过不少麻烦. 特此整理了一份详细的实验,比较None和NaN在不同…
python和java,.net,php web平台交互最好使用web通信方式,不要使用Jypython,IronPython,这样的好处是能够保持程序模块化,解耦性好 python允许使用'''...'''方式来表示多行代码: >>> print(r'''Hello, ... Lisa!''') Hello, Lisa! >>> >>> print('''line1 ... line2 ... line3''') line1 line2 line3…
一.jupyter的常用快捷键 - 插入cell: a, b   a是after从后插入  a是before 从前插入 - 删除cell: dd, x 都可以 - 修改cell的模式:m, y - tab: 自动补全 - 执行cell: shift + enter - 打开帮助文档:shift + tab 二. numpy 1. 创建数组 import numpy as np np.array() 一维数组创建:np.array([1,2,3]) 2. 使用matplotlib获取一个numpy…
Python pandas: check if any value is NaN in DataFrame # 查看每一列是否有NaN: df.isnull().any(axis=0) # 查看每一行是否有NaN: df.isnull().any(axis=1) # 查看所有数据中是否有NaN最快的: df.isnull().values.any() # In [2]: df = pd.DataFrame(np.random.randn(1000,1000)) In [3]: df[df > 0…
Abstract During the course fo doing data analysis and modeling, a significant amount of time is spend on data preparation: loading, cleaning, transforming, and rearrangin. 在整个数据分析建模过程中, 大量的时间(80%)的时间是用在了数据的预处理中, 如数据清洗, 加载, 标准化, 重塑等. Such tasks are of…
机器学习 什么是机器学习? 机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测 机器学习存在的目的和价值领域? 领域: 医疗.航空.教育.物流.电商 等... 目的: 让机器学习程序替换手动的步骤,减少企业的成本也提高企业的效率 jupyter lab语法使用 jupyter lab安装 命令:pip install jupyterlab 接下来了解下机器学习三剑客的前两位 numpy + pandas 的使用 一.区别Numpy:是数值计算的扩展包,它能高效处理N维数组,…
2.利用Pandas处理数据2.1 汇总计算当我们知道如何加载数据后,接下来就是如何处理数据,虽然之前的赋值计算也是一种计算,但是如果Pandas的作用就停留在此,那我们也许只是看到了它的冰山一角,它首先比较吸引人的作用是汇总计算 (1)基本的数学统计计算这里的基本计算指的是sum.mean等操作,主要是基于Series(也可能是来自DataFrame)进行统计计算.举例如下: #统计计算 sum mean等 import numpy as np import pandas as pd df=p…
import pandas as pdpd.merge(dataframe1,dataframe2,on='common_field',how='outer') replace NaN dataframe1.fillna(0) #replace NaN to 0 transform from dataframe to Numpy array np.array(dataframe['column'])…
记性不好,多记录些常用的东西,真·持续更新中::先列出一些常用的网址: 参考了的 莫烦python pandas DOC numpy DOC matplotlib 常用 习惯上我们如此导入: import pandas as pd import numpy as np import maplotlib.pyplot as plt pandas 篇 pd.Series是一种一维的数组结构,可以列表形式初始化,得到的Series的index默认∈[0,n) s = pd.Series([1, 3,…
python应用通常需要一些库,比如numpy.pandas等,安装也很简单,直接通过pip # pip install numpyRequirement already satisfied: numpy in /export/App/anaconda2/lib/python2.7/site-packages # pip install pandasRequirement already satisfied: pandas in /export/App/anaconda2/lib/python2…