Pandas 是基于Numpy 的一种工具,是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

安装命令:pip install pandas

具体操作如下:值得注意得是配置环境变量和添加项目路径要优先于导包 否则系统将检测不到pandas库

#导包
import os
import sys
#将脚本所在得工程添加到环境变量 绝对路径
sys.path.append('c:/Users/王建/www/mymac')
#相对路径
sys.path.append('../mymac')
#将项目路径添加到系统搜索路径
os.environ["DJANGO_SETTINGS_MODULE"] = 'mymac.settings'
#导入django模块
import django
#导入pandsa
import numpy as np
import pandas as pd
#导入sqlalchemy
from sqlalchemy import create_engine
#加载项目配置
django.setup()
#加载数据类
from myapp.models import Student
if __name__ == "__main__":
#加入数据库引擎
engine = create_engine('mysql+pymysql://root:mysql@localhost:3306/mymac')
#sql语句
sql = ' select * from student '
#建立数据框架
df = pd.read_sql_query(sql,engine)
print(df)
# 按照年龄正序 加ascending=False倒序
# 类似sql语句 select * from student order by age asc 或者 desc
df = df.sort_values(["age","height"],ascending=False)
print(df)
# 取年龄最小得学生
# select * from student order by age limit 1
df = df.sort_values(["age"])
print(df)
# 求整个班级得平均年龄 使用loc方法指定字段
print(df.mean())
print(df.mean(0))
print(df.mean(1))
print(df.loc[df['gender'] == 0].age.mean())
avg_age = df.loc[df['gender'] == 0].age.mean()
print(df.loc[ (df['age'] < avg_age) & (df['gender'] == 0) ])
# 取全班得平均年龄
print(df.age.mean())
# 全班年龄求个
print(df.age.sum())
# 获取男生得年龄求和
print(df.loc[df['gender']==1].age.sum())
# 取全班年龄最小
print(df.age.min())
# 或者 |
print(df.loc[(df['gender'] == 0) | (df['gender'] == 1)])
# 获取人数
print(df.id.count())
# 排除法
print(df.loc[(df['gender'] != 0) & (df['gender'] != 1)])
# 修改操作
df.loc[1,'gender'] = 1
print(df)
df.loc[0,'age'] = 10
print(df)
# 取单值
print(df.loc[5,'name'])
# 获取指定字段
print(df.loc[df['gender'] == 1 , ['id','name','age','height']])
# 将dataframe写入数据表 表名,数据引擎 索引是否入库
df.to_sql('student_copy',engine,index=False)
# 导出excel文件
# df.to_excel('student.xlsx')
# print(Student.objects.all())
 
参考数据库表:

机器学习三剑客之Pandas中DataFrame基本操作的更多相关文章

  1. Pandas中DataFrame修改列名

    Pandas中DataFrame修改列名:使用 rename df = pd.read_csv('I:/Papers/consumer/codeandpaper/TmallData/result01- ...

  2. Spark与Pandas中DataFrame对比

      Pandas Spark 工作方式 单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈 分布式并行计算框架,内建并行机制paral ...

  3. pandas中DataFrame的ix,loc,iloc索引方式的异同

    pandas中DataFrame的ix,loc,iloc索引方式的异同 1.loc: 按照标签索引,范围包括start和end 2.iloc: 在位置上进行索引,不包括end 3.ix: 先在inde ...

  4. Spark与Pandas中DataFrame对比(详细)

      Pandas Spark 工作方式 单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈 分布式并行计算框架,内建并行机制paral ...

  5. 机器学习 三剑客 之 pandas + numpy

    机器学习 什么是机器学习? 机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测 机器学习存在的目的和价值领域? 领域: 医疗.航空.教育.物流.电商 等... 目的: 让机器学习 ...

  6. pandas中DataFrame对象to_csv()方法中的encoding参数

    当使用pd.read_csv()方法读取csv格式文件的时候,常常会因为csv文件中带有中文字符而产生字符编码错误,造成读取文件错误,在这个时候,我们可以尝试将pd.read_csv()函数的enco ...

  7. pandas中DataFrame和Series的数据去重

    在SQL语言中去重是一件相当简单的事情,面对一个表(也可以称之为DataFrame)我们对数据进行去重只需要GROUP BY 就好. select custId,applyNo from tmp.on ...

  8. pandas中DataFrame重置设置索引

    在pandas中,经常对数据进行处理 而导致数据索引顺序混乱,从而影响数据读取.插入等. 小笔总结了以下几种重置索引的方法: import pandas as pd import numpy as n ...

  9. pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)

    数据介绍 先随机生成一组数据: import pandas as pd import numpy as np state = ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'N ...

随机推荐

  1. 洛谷P2866 [USACO06NOV]糟糕的一天Bad Hair Day(单调栈)

    题目描述 Some of Farmer John's N cows (1 ≤ N ≤ 80,000) are having a bad hair day! Since each cow is self ...

  2. 2018-06-20 中文代码示例视频演示Python入门教程第三章 简介Python

    知乎原链 Python 3.6.5官方入门教程中示例代码汉化后演示 对应在线文档: 3. An Informal Introduction to Python 不知如何合集, 请指教. 中文代码示例P ...

  3. 【代码笔记】Web-Javascript-Javascript typeof

    一,效果图. 二,代码. <!DOCTYPE html> <html> <head> <meta charset="utf-8"> ...

  4. 如何用ABP框架快速完成项目(10) - ABP只要加人即可马上加快项目进展- 全栈篇(1) - 发挥DDD理论优势的时候到了!

    正如我在<程序员英语二三事(2) - 从听开始>里说的, 任何技术/工具/语言都有其适用场景和上下文环境. DDD理论同样是如此.   现在, 终于到了发挥DDD理论优势的时候啦!   一 ...

  5. python爬虫从入门到放弃(九)之 Requests+正则表达式爬取猫眼电影TOP100

    import requests from requests.exceptions import RequestException import re import json from multipro ...

  6. Android getprop 读取的属性哪里来的?

    Android  getprop 和  setprop 可以对系统属性进行读取和设置. 通过串口执行以下 geyprop    打印出来的属性让你一目了然. 属性出来了,但是在哪里设置的呢,这里有两个 ...

  7. JAVA设计模式——代理(动态代理)

    传送门:JAVA设计模式——代理(静态代理) 序言: 在学习Spring的时候,我们知道Spring主要有两大思想,一个是IoC,另一个就是AOP,对于IoC,依赖注入就不用多说了,而对于Spring ...

  8. spring applicationContext.xml最全约束

    <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.sp ...

  9. java应用系统运行速度慢的解决方法

    场景:我们在部署了TOMCAT应用,刚刚开始启动的一个段时间内.访问系统的速度比较快.但是过了一段时间,应用系统就慢慢的变慢起来了.服务的访问加载时间慢慢变长. 问题解决思路: 1,查看部署应用系统的 ...

  10. Linux 安装golang

    访问官方下载地址 或 https://studygolang.com/dl ,32位系统下载go1.9.4.linux-386.tar.gz,64位系统下载go1.9.4.linux-amd64.ta ...