[Python]-pandas模块-机器学习Python入门《Python机器学习手册》-02-加载数据:加载文件
《Python机器学习手册——从数据预处理到深度学习》
这本书类似于工具书或者字典,对于python具体代码的调用和使用场景写的很清楚,感觉虽然是工具书,但是对照着做一遍应该可以对机器学习中python常用的这些库有更深入的理解,在应用中也能更为熟练。
02-加载数据
包括:
- 加载样本数据集
 - 创建仿真数据集
 - 加载CSV文件
 - 加载Excel文件
 - 加载json文件
 - 查询SQL数据库
 
其中1、2部分内容主要是sklearn库中datasets的基本应用,在02-加载数据:加载数据集进行详细叙述。
3-6部分主要是不同文件的读入,采用pandas模块,本文也会结合其他笔记进行补充。
02-3 加载CSV文件
CSV文件读写之前写过一篇,基本满足日常需求:https://www.cnblogs.com/camilia/p/16008389.html
在实际使用中会随时进行补充。
02-4 加载Excel文件
import pandas as pd
# sheetname 指加载哪张数据表,可以是表名字符串,也可以是表号(0开始)
# 如果需要读取多个表,sheetname可以作为列表,返回值为dataframe的字典
dataframe = pd.read_excel(url, sheetname = 0, header = 1)
02-5 加载json文件
import pandas as pd
dataframe = pd.read_json(url, orient = 'columns')
orient有多个选择状态,参考:https://blog.csdn.net/qq_41562377/article/details/90203805
最终也是将字符串数据转换为dataframe格式。
也可以采用json模块直接读取字典或列表。
02-6 查询SQL数据库
import pandas as pd
from sqlalchemy import create_engine
# 创建一个数据库的连接
database_connection = create_engine('sqline:///sample.db')
# 加载数据
dataframe = pd.read_sql_query('SELECT * FROM data', database_connection)
												
											[Python]-pandas模块-机器学习Python入门《Python机器学习手册》-02-加载数据:加载文件的更多相关文章
- [Python]-pandas模块-机器学习Python入门《Python机器学习手册》-03-数据整理
		
<Python机器学习手册--从数据预处理到深度学习> 这本书类似于工具书或者字典,对于python具体代码的调用和使用场景写的很清楚,感觉虽然是工具书,但是对照着做一遍应该可以对机器学习 ...
 - 关于Python pandas模块输出每行中间省略号问题
		
关于Python数据分析中pandas模块在输出的时候,每行的中间会有省略号出现,和行与行中间的省略号....问题,其他的站点(百度)中的大部分都是瞎写,根本就是复制黏贴以前的版本,你要想知道其他问题 ...
 - [Python]-pandas模块-CSV文件读写
		
Pandas 即Python Data Analysis Library,是为了解决数据分析而创建的第三方工具,它不仅提供了丰富的数据模型,而且支持多种文件格式处理,包括CSV.HDF5.HTML 等 ...
 - python pandas模块,nba数据处理(1)
		
pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数.pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据(如SQL)灵活的数据处理能力.它提供了复杂精细的索引功 ...
 - python - json模块使用 / 快速入门
		
json基本格式 """ json格式 -> [{}, {}]: [{ "name": "Bob", "gende ...
 - python: pandas模块
		
10分钟入门 pandas 评:我跟作者的智商差距是有多大,才能让我用60分钟看完作者认为10分钟的内容... 详细内容见 Cookbook 习惯上我们先导入 : In [1]: import pan ...
 - python pandas模块简单使用(读取excel为例)
		
第一步:模块安装 pip install pandas 第二步:使用(单个工作表为例) 说明:如果有多个工作表,那么只要指定sheetname=索引,(第一个工作表为0,第二个工作表为1,以此类推) ...
 - 吴裕雄--天生自然python学习笔记:pandas模块用 dataframe.loc 通过行、列标题读取数据
		
用 df.va lue s 读取数据的前提是必须知道学生及科目的位置,非常麻烦 . 而 df.loc 可直接通过行.列标题读取数据,使用起来更为方便 . 使用 df.loc 的语法为: 行标题或列标题 ...
 - python pickle模块的使用/将python数据对象序列化保存到文件中
		
# Python 使用pickle/cPickle模块进行数据的序列化 """Python序列化的概念很简单.内存里面有一个数据结构, 你希望将它保存下来,重用,或者发送 ...
 
随机推荐
- 到点了开始网抑云(悲)但是用python(整活)
			
写在前面的一点网抑云: 爱情不是随便许诺好了不想再说了没错 是我那么多的冷漠 让你感觉到无比的寂寞不过 一个女人的不仅仅渴望得到的一个承诺我害怕欺骗也害怕寂寞更害怕我的心会渐渐地凋落爱情不是随便许诺好 ...
 - Active Backup for Business激活
			
依次执行 https://IP地址:5001/webapi/auth.cgi?api=SYNO.API.Auth&method=Login&version=1&account= ...
 - cx_Oracle.DatabaseError: ORA-28759: failure to open file
			
找了好久这个问题,有人说是tcps的问题,需要自己生成证书什么的,后来才发现原来是 钱包文件路径 的问题,钱包文件解压后必须放在instantclien/network/admin下,在Windows ...
 - from Crypto.Cipher import AES报错
			
python 在 Windows下使用AES时要安装的是pycryptodome 模块 pip install pycryptodome python 在 Linux下使用AES时要安装的是pyc ...
 - 近期碰到的一些面试题--WPF、C#、数据库
			
最近想换工作的念头特别强烈,面了几家公司没有拿到满意的offer,心仪的公司面完锁HC,有点无奈,感觉今年有点卷,把碰到过的面试题总结下. WPF相关: 1.定义依赖属性需要注意哪些地方? (1)依赖 ...
 - Linux一些错误总结
			
1.cannot verify <mydomainname> certificate, issued by '/C=US/O=Let's Encrypt/CN=R3': 解决1:wget ...
 - Windows环境安装Hadoop环境
			
1,下载Hadoop,解压 2,配置Hadoop环境变量 右键此电脑--属性 高级系统设置 环境变量 新建一个HADOOP_HOME 添加到path 3,cmd窗口查看安装情况:hadoop vers ...
 - YII容器类依赖注入
			
程序 = 算法 + 数据结构 数据结构 制约了 算法的===>>>>依赖注入 依赖注入也就是解数据结构和算法耦合的思想 <?php /** * Created by Ph ...
 - 利用基于Python的Pelican打造一个自己的个人纯静态网站
			
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_100 其实呢这么多年以来我一直建议每个有技术追求的开发者都要有写技术博客记笔记的良好习惯,一来可以积累知识,二来可以帮助别人,三来 ...
 - Docker-Compose和Docker Network的应用
			
1 # Docker-Compose分为两部分 2 # 一.Docker-Compose.yml 3 # 二.Docker-Compose 命令 4 5 # 桌面板的Docker(Win.Mac)会默 ...