pandas 存取数据小笔记

import pandas as pd

1. 读取和保存 csv文件

#读

df = pd.read_csv(read_file_path, header=0)

# 其中read_file_path 为字符串，为读的文件所在路径

# 比如 "../cj_data/query_result.csv"

# header=0 意思是第一行包含字段名，可以通过df.columns 取到列名

#保存

df.to_csv(save_file_path)

2. pandas如何根据字段进行过滤

df = df[                                              # [] 为读取操作符

           (df['course_id'] == course_id)         # == 等于

        & (df['member_id'] == str(member_id))    # & 来关联多个筛选条件，

          ]

3. python脚本运行日志保存

import logging

dt = time.strftime("%Y%m%d")

# 读取当前日期

logfile = project_folder + "log/log_" + str(dt) + ".txt"

logging.basicConfig(filename=logfile, filemode='a', level=logging.INFO)

# 设置日志级别，开始写入日志



logger = logging.getLogger(__name__)

logger.info('write_member_result ...')

logger.info(str(time.strftime("%Y-%m-%d %H:%M:%S")))

#日志内容全靠logger.info

#类似于print，但是可以保存日志文件，来帮助定位问题

4. 排序，生成序列号

    df = df.sort_values(by='lesson_start_time', ascending=True)

    # 函数是pandas的sort_values

    df['lesson_order'] = range(df.shape[0])

    # 生成序号是从0开始的

    df['lesson_order'] = [i+1 for i in df['lesson_order']]

    # 序列号+1，变成从1开始

5. join操作

df3 = pd.merge(df, df2, how='left', on=['member_id', 'lesson_id'])

# 两个dataframe根据主键进行join

6. dataframe 某个字段的类型转化

df['col2'] = df['col2'].astype('float64')

print '-----------'

print df.dtypes

7. spark 和python的 Data Frame之间互相转换

8. python 对hive读和写

pandas 存取数据小笔记的更多相关文章

pandas之数据IO笔记
pandas在进行数据存储与输出时会做一些相应的操作 1.*索引:将一个列或多个列读取出来构成DataFrame,其中涉及是否从文件中读取索引以及列名 2 *类型推断和数据转换:包括用户自定义的转换以 ...
【笔记】Pandas分类数据详解
[笔记]Pandas分类数据详解 Pandas Pandas分类数据详解|轻松玩转Pandas(5) 参考:Pandas分类数据详解|轻松玩转Pandas(5)
关于 linux中TCP数据包(SKB)序列号的小笔记
关于 SKB序列号的小笔记为了修改TCP协议,现在遇到了要改动tcp分组的序列号,但是只是在tcp_sendmsg函数中找到了SKB的end_seq 一直没有找到seq 不清楚在那里初始化了,就 ...
使用SharePreferences存取数据（慕课笔记）
0.视频地址:http://www.imooc.com/video/3265 1.使用SharePreferences存取数据: public class MainActivity extends A ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...
【转载】使用Pandas进行数据提取
使用Pandas进行数据提取本文转载自:蓝鲸的网站分析笔记原文链接:使用python进行数据提取目录 set_index() ix 按行提取信息按列提取信息按行与列提取信息提取特定日期的信 ...
【转载】使用Pandas进行数据匹配
使用Pandas进行数据匹配本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas进行数据匹配目录 merge()介绍 inner模式匹配 lefg模式匹配 right模式匹配 outer模式 ...
【转载】使用Pandas创建数据透视表
使用Pandas创建数据透视表本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas创建数据透视表目录 pandas.pivot_table() 创建简单的数据透视表增加一个行维度(inde ...
转：【iOS开发每日小笔记（十一）】iOS8更新留下的“坑” NSAttributedString设置下划线 NSUnderlineStyleAttributeName 属性必须为NSNumber
http://www.bubuko.com/infodetail-382485.html 标签:des class style 代码 html 使用问题文件数据 ...

随机推荐

@SpringBootApplication(exclude = {DataSourceAutoConfiguration.class}) 注解的作用
在学习boot 项目的时候 ,发现在启动类中有一个这个的注解 @SpringBootApplication(exclude = {DataSourceAutoConfiguration.class}) ...
oh_my_zsh
oh_my_zsh zsh默认已经安装 cat /etc/shells 查看安装没有 (https://xiaozhou.net/learn-the-command-line-iterm ...
Altera FPGA SoC搭建步骤
Altera SoC 官方搭建指南: https://rocketboards.org/foswiki/Documentation/EmbeddedLinuxBeginnerSGuide 官方文档中除 ...
有关导出Excel特殊字符的问题
在导出Excel的时候,如果在一个单元格的最前面有一个双引号(英文状态下),这个单元格一定要将其关闭这个双引号,否则会自动向下匹配同列单元格的双引号,从而导致串行,出现错误数据
2--Postman脚本介绍
Postman是访问各种API的客户端.它的强大之处在于其允许在对某一个request访问的之前和之后分别运行自定义的一段Javascript脚本,可以将数条request连结成一个流程完成一体化测试 ...
LADP(Lightweight Directory Access Protocol)轻量目录访问协议~小知识
What is LDAP and how does it work(implementation)? LDAP stands for “Lightweight Directory Access Pro ...
Discuz! X3 全新安装图文教程
Discuz! 是腾讯旗下 Comsenz 公司推出的以社区为基础的专业建站平台,帮助网站实现一站式服务.让论坛(BBS).个人空间(SNS).门户(Portal).群组(Group).应用开放平台( ...
自己封装一个弹窗JS
在我们平时的开发中,一定有很多地方需要用到弹窗提示功能.而系统自带的弹窗奇丑无比,而且我们不能自主控制.因此我们在开发过程中,自己封装一个弹窗JS方便我们使用. 代码demo如下: // JavaSc ...
java实验四《Android程序设计》实验报告
一.实验报告封面课程:Java程序设计班级:1653班姓名:张士洋学号:20165308 指导教师:娄嘉鹏实验日期:2018年5月14日实验时间:13:45 - 15:25 实验序号:08 ...
MySQL通过分组计算百分比
公司在做柯米克的分析报告,需要我这边把汽车之家柯米克论坛的评论数据和评论用户所在地的数据获取,通过爬虫的方式很快的解决了数据的问题,但是需要我提取下各省评论人数的比例,所以在数据库里面直接计算了相关的 ...

pandas 存取数据小笔记

1. 读取和保存 csv文件

2. pandas如何根据字段进行过滤

3. python脚本运行日志保存

4. 排序，生成序列号

5. join操作

6. dataframe 某个字段的类型转化

7. spark 和python的 Data Frame之间互相转换

8. python 对hive读和写

pandas 存取数据小笔记的更多相关文章

随机推荐

热门专题