pandas 存取数据小笔记

import pandas as pd

1. 读取和保存 csv文件

#读

df = pd.read_csv(read_file_path, header=0)

# 其中read_file_path 为字符串，为读的文件所在路径

# 比如 "../cj_data/query_result.csv"

# header=0 意思是第一行包含字段名，可以通过df.columns 取到列名

#保存

df.to_csv(save_file_path)

2. pandas如何根据字段进行过滤

df = df[                                              # [] 为读取操作符

           (df['course_id'] == course_id)         # == 等于

        & (df['member_id'] == str(member_id))    # & 来关联多个筛选条件，

          ]

3. python脚本运行日志保存

import logging

dt = time.strftime("%Y%m%d")

# 读取当前日期

logfile = project_folder + "log/log_" + str(dt) + ".txt"

logging.basicConfig(filename=logfile, filemode='a', level=logging.INFO)

# 设置日志级别，开始写入日志



logger = logging.getLogger(__name__)

logger.info('write_member_result ...')

logger.info(str(time.strftime("%Y-%m-%d %H:%M:%S")))

#日志内容全靠logger.info

#类似于print，但是可以保存日志文件，来帮助定位问题

4. 排序，生成序列号

    df = df.sort_values(by='lesson_start_time', ascending=True)

    # 函数是pandas的sort_values

    df['lesson_order'] = range(df.shape[0])

    # 生成序号是从0开始的

    df['lesson_order'] = [i+1 for i in df['lesson_order']]

    # 序列号+1，变成从1开始

5. join操作

df3 = pd.merge(df, df2, how='left', on=['member_id', 'lesson_id'])

# 两个dataframe根据主键进行join

6. dataframe 某个字段的类型转化

df['col2'] = df['col2'].astype('float64')

print '-----------'

print df.dtypes

7. spark 和python的 Data Frame之间互相转换

8. python 对hive读和写

pandas 存取数据小笔记的更多相关文章

pandas之数据IO笔记
pandas在进行数据存储与输出时会做一些相应的操作 1.*索引:将一个列或多个列读取出来构成DataFrame,其中涉及是否从文件中读取索引以及列名 2 *类型推断和数据转换:包括用户自定义的转换以 ...
【笔记】Pandas分类数据详解
[笔记]Pandas分类数据详解 Pandas Pandas分类数据详解|轻松玩转Pandas(5) 参考:Pandas分类数据详解|轻松玩转Pandas(5)
关于 linux中TCP数据包(SKB)序列号的小笔记
关于 SKB序列号的小笔记为了修改TCP协议,现在遇到了要改动tcp分组的序列号,但是只是在tcp_sendmsg函数中找到了SKB的end_seq 一直没有找到seq 不清楚在那里初始化了,就 ...
使用SharePreferences存取数据（慕课笔记）
0.视频地址:http://www.imooc.com/video/3265 1.使用SharePreferences存取数据: public class MainActivity extends A ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...
【转载】使用Pandas进行数据提取
使用Pandas进行数据提取本文转载自:蓝鲸的网站分析笔记原文链接:使用python进行数据提取目录 set_index() ix 按行提取信息按列提取信息按行与列提取信息提取特定日期的信 ...
【转载】使用Pandas进行数据匹配
使用Pandas进行数据匹配本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas进行数据匹配目录 merge()介绍 inner模式匹配 lefg模式匹配 right模式匹配 outer模式 ...
【转载】使用Pandas创建数据透视表
使用Pandas创建数据透视表本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas创建数据透视表目录 pandas.pivot_table() 创建简单的数据透视表增加一个行维度(inde ...
转：【iOS开发每日小笔记（十一）】iOS8更新留下的“坑” NSAttributedString设置下划线 NSUnderlineStyleAttributeName 属性必须为NSNumber
http://www.bubuko.com/infodetail-382485.html 标签:des class style 代码 html 使用问题文件数据 ...

随机推荐

POJ 3254 Corn Fields (状压入门)
Farmer John has purchased a lush new rectangular pasture composed of M by N (1 ≤ M≤ 12; 1 ≤ N ≤ 12) ...
.Net Core 控制台程序生产exe
打开csproj ,添加一行 <RuntimeIdentifier>win10-x64</RuntimeIdentifier> 具体如下: <Project Sdk=&q ...
野(wild)指针与悬空(dangling)指针
1. 什么是野指针(wild pointer)? A pointer in c which has not been initialized is known as wild pointer. 野指针 ...
开始一个django项目的流程
1.明确开发站点的主题,(即此站点的作用), 确定站点的各种功能,需求. 2.优先设计数据库. 数据库的设计要合理,不能想当然的设计,最好能够以表格的形式展现出来,避免以后遗忘,也避免内容的重复. 3 ...
Linux目录路径知识
改IP为静态IP
s21day12 python笔记
s21day12 python笔记一.函数中高级 1.1 函数可以做返回值 #示例: def func(): print(123) def bar(): return func v = bar() ...
s21day11 python笔记
s21day11 python笔记一.函数小高级函数名可以当作变量来使用 #示例一: def func(): print(123) func_list = [func, func, func] # ...
struts2多文件上传-2
 <action name="UploadAction2_*" class="uploadfile.UploadAction ...
fromkeys()
#fromkeys() #说明:用于创建一个新字典,以序列seq中元素做字典的键,value为字典所有键对应的初始值 #案例 d=[1,2,3] dict={} dict=dict.fromkeys( ...
c#读sql server数据添加到MySQL数据库
using System;using System.Collections.Generic;using System.Text;using Console = System.Console;using ...

pandas 存取数据小笔记

1. 读取和保存 csv文件

2. pandas如何根据字段进行过滤

3. python脚本运行日志保存

4. 排序，生成序列号

5. join操作

6. dataframe 某个字段的类型转化

7. spark 和python的 Data Frame之间互相转换

8. python 对hive读和写

pandas 存取数据小笔记的更多相关文章

随机推荐

热门专题