1、Numpy

  安装:pip install numpy 

[root@kvm work]# cat numpy_test.py
#!/usr/bin/env python
#coding:utf-8

from __future__ import print_function

# 导入模块并添加别名
import numpy as np

# 创建数组
a = np.array([2,0,1,7])

print(a)
print(a[:3])
print(a.min())
a.sort()
print(a)

# 创建二维数据
b = np.array([[1,2,3],[4,5,6]])
print(b)
print(b*b)

[root@kvm work]# python numpy_test.py
[2 0 1 7]
[2 0 1]
0
[0 1 2 7]
[[1 2 3]
 [4 5 6]]
[[ 1  4  9]
 [16 25 36]]

简单使用

2、Scipy

  安装:pip install Scipy

# coding : utf-8
# 求解非线性方程组2x1 - x2^2 = 1, x1^2 - x2 = 2

# 导入求解方程组的函数
from scipy.optimize import fsolve

# 定义求解方程组
def f(x):
    x1 = x[0]
    x2 = x[1]
    return [2*x1 - x2**2 - 1, x1**2 - x2 - 2]

# 输入初值[1 ,1]并求解
result = fsolve(f, [1, 1])
print(result)

# 数值积分
#导入积分函数
from scipy import integrate
# 定义被积函数
def g(x):
    return (1 - x**2)**0.5

pi_2, err = integrate.quad(g, -1, 1) #积分结果和误差
print(pi_2 * 2) #由微积分知识知道结果为圆周率pi的一半

简单使用

3、Matplotlib

  安装:pip install matplotlib

# coding: utf-8
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10 ,1000) #作图的变量自变量
y = np.sin(x) + 1 #因变量y
z = np.cos(x ** 2) + 1 #因变量z

# 设置图像大小
plt.figure(figsize=(8, 4))
# 作图,设置标签、线条颜色、线条大小
plt.plot(x, y, label='$\sin x+1$', color='red', linewidth=2)
# 作图,设置标签、线条类型
plt.plot(x, z, 'b--', label='$\cos x^2+1$')
plt.xlabel('Time(s)') #设置x轴名称
plt.ylabel('Volt') #y轴名称
plt.title('A Simple Example') #标题
plt.ylim(0, 2.2) #显示的y轴范围
plt.legend() #显示图例
plt.show() #显示作图结果

简单使用

  作图结果:

  

4、Pandas

  安装:pip install pandas

# coding: utf-8
import pandas as pd

s = pd.Series([1, 2, 3], index=['a', 'b', 'c']) #创建一个序列s
d = pd.DataFrame([[1,2,3],[4,5,6]], columns=['a', 'b', 'c']) #创建一个表
d2 = pd.DataFrame(s) #也可以用已有的序列创建一个表

d.head() #预览前5行数据
d.describe() #数据基本统计量
print(d)
print(d2)

# 读取文件,注意文件的存储路径不能带有中文,否则读取可能出错
pd.read_excel('data.xlsx') # 读取Excel文件,创建DataFrame
pd.read_csv('company_name.csv', encoding='gbk') #读取文本格式的数据

简单使用

5、StatsModels

  安装:pip install statsmodels

# coding: utf-8

# 导入ADF校验
from statsmodels.tsa.stattools import adfuller as ADF
import numpy as np

# 返回的结果有ADF值、p值等
print(ADF(np.random.rand(100)))

简单使用

5、Scikit-Learn

  安装:pip install scikit-learn

# coding: utf-8

# 导入线性回归模型
from sklearn.linear_model import LinearRegression
# 建立线性回归模型
model = LinearRegression()
print(model)

# 导入数据集
from sklearn import datasets
# 加载数据集
iris = datasets.load_iris()
# 查看数据集大小
print(iris.data.shape)

# 导入SVM模型
from sklearn import svm
# 建立线性SVM分类器
clf = svm.LinearSVC()
# 用数据训练模型
clf.fit(iris.data, iris.target)
# 训练完成模型之后输入新的数据进行预测
clf.predict([[ 5.0, 3.6, 1.3, 0.25 ]])

#查看训练好模型的参数
print(clf.coef_)

简单使用

Python数据分析(一):工具的简单使用的更多相关文章

  1. python数据分析的工具环境

    python做数据分析的优势: 拥有大量的库为数据分析和处理提供了完整的工具链 随着库还在不断的增加的同时, 算法的实现也更加的创新.Numpy, matplotlib, scipy,scikit-l ...

  2. python数据分析中常用的库

    Python是数据处理常用工具,可以处理数量级从几K至几T不等的数据,具有较高的开发效率和可维护性,还具有较强的通用性和跨平台性,这里就为大家分享几个不错的数据分析工具,需要的朋友可以参考下 Pyth ...

  3. Python数据分析工具:Pandas之Series

    Python数据分析工具:Pandas之Series Pandas概述Pandas是Python的一个数据分析包,该工具为解决数据分析任务而创建.Pandas纳入大量库和标准数据模型,提供高效的操作数 ...

  4. Python 数据分析中常用的可视化工具

    Python 数据分析中常用的可视化工具 1 Matplotlib 用于创建出版质量图表的绘图工具库,目的是为 Python 构建一个 Matlab 式的绘图接口. 1.1 安装 Anaconada ...

  5. Python包管理工具和多版本环境管理

    1. Python包管理工具 在安装Python包的过程中,经常涉及到distutils.setuptools.distribute.setup.py.easy_install.easy_instal ...

  6. 《Python数据分析与挖掘实战》读书笔记

    大致扫了一遍,具体的代码基本都没看了,毕竟我还不懂python,并且在手机端的排版,这些代码没法看. 有收获,至少了解到以下几点: 一. Python的语法挺有意思的     有一些类似于JavaSc ...

  7. (python数据分析)第03章 Python的数据结构、函数和文件

    本章讨论Python的内置功能,这些功能本书会用到很多.虽然扩展库,比如pandas和Numpy,使处理大数据集很方便,但它们是和Python的内置数据处理工具一同使用的. 我们会从Python最基础 ...

  8. Python测试 ——开发工具库

    Web UI测试自动化 splinter - web UI测试工具,基于selnium封装. selenium - web UI自动化测试. mechanize- Python中有状态的程序化Web浏 ...

  9. Python数据分析必备Anaconda安装、快捷键、包安装

    Python数据分析必备: 1.Anaconda操作 Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便 ...

  10. [python] 使用scikit-learn工具计算文本TF-IDF值

    在文本聚类.文本分类或者比较两个文档相似程度过程中,可能会涉及到TF-IDF值的计算.这里主要讲述基于Python的机器学习模块和开源工具:scikit-learn.        希望文章对你有所帮 ...

随机推荐

  1. hive 和Hbase的pom文件

    <hadoop-common></hadoop-common> <hadoop-hdfs></hadoop-hdfs> <dependency&g ...

  2. Unix系统编程()深入探究文件IO概述

    open调用将引入原子atomicity操作的概念. 将某一系统调用所要完成的各个动作作为不可中断的操作,一次性加以执行. 原子操作是许多系统调用得以正确执行的必要条件. 还介绍一个系统调用fcntl ...

  3. Qt下QTableWidget的使用

    1.QTableWidget的基本设置 ui->tableWidget->setColumnCount(11); ui->tableWidget->setRowCount(Nu ...

  4. 浅谈HTTP中Get与Post的区别_转

    可参考:HTTP请求中POST与GET的区别 Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE.URL全称是资源描述符,我们可以这样认为:一个UR ...

  5. 微信小程序 - toptip效果

    在Page顶部下滑一个提示条 , 代码见 /mixins/UIComponent.js ,其中的self 可以认为是微信小程序的Page对象 效果: 默认2秒展示,上移动画隐藏 /** * 展示顶部 ...

  6. 工业级别sd卡存贮slc mlc tlc

    slc mlc tlc SLC = Single-Level Cell ,即1bit/cell,速度快寿命长,价格超贵(约MLC 3倍以上的价格),约10万次擦写寿命 MLC = Multi-Leve ...

  7. 小结:trie

    复杂度: 查找O(n),维护O(n),空间O(sum(len[i])) 概要: 就是每个节点对应一个字母,然后儿子有26个,查找和维护时进入对应儿子即可. 应用:在字符串匹配中多模匹配做基础结构:可以 ...

  8. MFC常见错误提示:opened in another editor

    有时候在使用MFC的过程中常常会遇到这种提示.假设你在看想必你也遇到这种烦恼. 没办法-- 把打开的文件所有关闭.然后你就发现期待的RC文件出现了! .!!!.!!!!!!! ! !.! !! .

  9. XAMPP phpmyadmin修改mysql密码

    我手动修改了mysql的root账户的密码,然后就访问不了phpmyadmin了. 解决方法: 打开xampp目录(默认的安装目录,如果修改,请找到xampp的安装目录),打开phpmyadmin的目 ...

  10. 返回flag

    //修改前namespace CleanCSharp.Errors.Dirty { public class SomeClass { public int DoSomeProcess(int? id) ...