1.读取文件为pandas格式: import pandas as pd import numpy as np dataset = pd.read_csv("C:/Users/Administrator/Desktop/test.csv",encoding='gbk') 这样就读取了一个csv文件作为dataframe格式的文件,结果如下: 2.查看读取数据的概况和维度使用如下命令: dataset.head() # 若括号不填写任何信息,默认查看df的前五行,当然也可以填写数字,填写…
python和java,.net,php web平台交互最好使用web通信方式,不要使用Jypython,IronPython,这样的好处是能够保持程序模块化,解耦性好 python允许使用'''...'''方式来表示多行代码: >>> print(r'''Hello, ... Lisa!''') Hello, Lisa! >>> >>> print('''line1 ... line2 ... line3''') line1 line2 line3…
原文链接:https://junjiecai.github.io/posts/2016/Oct/20/none_vs_nan/ 建议从这里下载这篇文章对应的.ipynb文件和相关资源.这样你就能在Jupyter中边阅读,边测试文中的代码. python原生的None和pandas, numpy中的numpy.NaN尽管在功能上都是用来标示空缺数据.但它们的行为在很多场景下确有一些相当大的差异.由于不熟悉这些差异,曾经给我的工作带来过不少麻烦. 特此整理了一份详细的实验,比较None和NaN在不同…
一.jupyter的常用快捷键 - 插入cell: a, b   a是after从后插入  a是before 从前插入 - 删除cell: dd, x 都可以 - 修改cell的模式:m, y - tab: 自动补全 - 执行cell: shift + enter - 打开帮助文档:shift + tab 二. numpy 1. 创建数组 import numpy as np np.array() 一维数组创建:np.array([1,2,3]) 2. 使用matplotlib获取一个numpy…
pandas是一个强大的Python数据分析的工具包. pandas是基于NumPy构建的. pandas的主要功能: 具备对其功能的数据结构DataFrame.Series 集成时间序列功能 提供丰富的数学运算和操作 灵活处理缺失数据 安装方法:pip install pandas 引用方法:import pandas as pd ------> 以下测试都是在ipython中 <------ Series Series是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组…
机器学习 什么是机器学习? 机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测 机器学习存在的目的和价值领域? 领域: 医疗.航空.教育.物流.电商 等... 目的: 让机器学习程序替换手动的步骤,减少企业的成本也提高企业的效率 jupyter lab语法使用 jupyter lab安装 命令:pip install jupyterlab 接下来了解下机器学习三剑客的前两位 numpy + pandas 的使用 一.区别Numpy:是数值计算的扩展包,它能高效处理N维数组,…
import pandas as pdpd.merge(dataframe1,dataframe2,on='common_field',how='outer') replace NaN dataframe1.fillna(0) #replace NaN to 0 transform from dataframe to Numpy array np.array(dataframe['column'])…
python应用通常需要一些库,比如numpy.pandas等,安装也很简单,直接通过pip # pip install numpyRequirement already satisfied: numpy in /export/App/anaconda2/lib/python2.7/site-packages # pip install pandasRequirement already satisfied: pandas in /export/App/anaconda2/lib/python2…
记性不好,多记录些常用的东西,真·持续更新中::先列出一些常用的网址: 参考了的 莫烦python pandas DOC numpy DOC matplotlib 常用 习惯上我们如此导入: import pandas as pd import numpy as np import maplotlib.pyplot as plt pandas 篇 pd.Series是一种一维的数组结构,可以列表形式初始化,得到的Series的index默认∈[0,n) s = pd.Series([1, 3,…
深入pandas 数据处理 三个阶段 数据准备 数据转化 数据聚合 数据准备 加载 组装 合并 - pandas.merge() 拼接 - pandas.concat() 组合 - pandas.DataFrame.combine_first() 变形 删除 合并 example1: import numpy as np import pandas as pd frame1 = pd.DataFrame({'id':['ball','pencil','pen','mug','ashtray'],…