Creating-reading-and-writing

教程

1.创建与导入

DataFrame

import pandas as pd

pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]})

生成的表如下：

我们正在使用pd.DataFrame（）构造函数来生成这些DataFrame对象。声明新字典的语法是字典，其关键字是列名（在此示例中为Yes和No），其值是条目列表。这是构造新DataFrame的标准方法，也是您最有可能遇到的一种方法。
字典列表构造函数将值分配给列标签，但仅对行标签使用从0（0、1、2、3，...）开始的递增计数。有时这可以，但是通常我们会自己分配这些标签。
DataFrame中使用的行标签列表称为索引。我们可以通过在构造函数中使用index参数来为其赋值：

pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'],

              'Sue': ['Pretty good.', 'Bland.']},

             index=['Product A', 'Product B'])

Series

相比之下，系列是数据值的序列。如果DataFrame是表，则Series是列表。实际上，您可以创建一个只包含一个列表的列表：

本质上，Series是DataFrame的单个列。因此，您可以使用索引参数，以与以前相同的方式将列值分配给Series。但是，系列没有列名，只有一个整体名：

Series和DataFrame密切相关。认为DataFrame实际上只是一堆“胶合在一起”的Series很有帮助。我们将在本教程的下一部分中看到更多信息。

2.读取数据文件

能够手动创建DataFrame或Series很方便。但是，在大多数情况下，我们实际上不会手工创建自己的数据。相反，我们将使用已经存在的数据。
数据可以多种不同形式和格式存储。到目前为止，最基本的是不起眼的CSV文件。当您打开CSV文件时，您将获得如下所示的内容：

因此，CSV文件是由逗号分隔的值表。因此，名称为：“逗号分隔值(Comma-Separated Values")”或CSV。
现在让我们搁置玩具数据集，看看当我们将其读入DataFrame时真实数据集的外观。我们将使用pd.read_csv（）函数将数据读取到DataFrame中。

Kaggle-pandas(1)的更多相关文章

由Kaggle竞赛wiki文章流量预测引发的pandas内存优化过程分享
pandas内存优化分享缘由最近在做Kaggle上的wiki文章流量预测项目,这里由于个人电脑配置问题,我一直都是用的Kaggle的kernel,但是我们知道kernel的内存限制是16G,如下: ...
kaggle入门2——改进特征
1:改进我们的特征在上一个任务中,我们完成了我们在Kaggle上一个机器学习比赛的第一个比赛提交泰坦尼克号:灾难中的机器学习. 可是我们提交的分数并不是非常高.有三种主要的方法可以让我们能够提高他: ...
Kaggle入门教程
此为中文翻译版 1:竞赛我们将学习如何为Kaggle竞赛生成一个提交答案(submisson).Kaggle是一个你通过完成算法和全世界机器学习从业者进行竞赛的网站.如果你的算法精度是给出数据集中最 ...
如何使用Python在Kaggle竞赛中成为Top15
如何使用Python在Kaggle竞赛中成为Top15 Kaggle比赛是一个学习数据科学和投资时间的非常的方式,我自己通过Kaggle学习到了很多数据科学的概念和思想,在我学习编程之后的几个月就开始 ...
kaggle数据挖掘竞赛初步--Titanic<原始数据分析&缺失值处理>
Titanic是kaggle上的一道just for fun的题,没有奖金,但是数据整洁,拿来练手最好不过啦. 这道题给的数据是泰坦尼克号上的乘客的信息,预测乘客是否幸存.这是个二元分类的机器学习问题 ...
kaggle& titanic代码
这两天报名参加了阿里天池的’公交线路客流预测‘赛,就顺便先把以前看的kaggle的titanic的训练赛代码在熟悉下数据的一些处理.题目根据titanic乘客的信息来预测乘客的生还情况.给了titan ...
初窥Kaggle竞赛
初窥Kaggle竞赛原文地址: https://www.dataquest.io/mission/74/getting-started-with-kaggle 1: Kaggle竞赛我们接下来将要 ...
逻辑回归应用之Kaggle泰坦尼克之灾(转）
正文:14pt 代码:15px 1 初探数据先看看我们的数据,长什么样吧.在Data下我们train.csv和test.csv两个文件,分别存着官方给的训练和测试数据. import pandas ...
kaggle之Grupo Bimbo Inventory Demand
Grupo Bimbo Inventory Demand kaggle比赛解决方案集合 Grupo Bimbo Inventory Demand 在这个比赛中,我们需要预测某个产品在某个销售点每周的需 ...
kaggle之人脸特征识别
Facial_Keypoints_Detection github code facial-keypoints-detection, 这是一个人脸识别任务,任务是识别人脸图片中的眼睛.鼻子.嘴的位置. ...

随机推荐

读《大话设计模式》——应用工厂模式的"商场收银系统"(WinForm)
要做的是一个商场收银软件,营业员根据客户购买商品单价和数量,向客户收费.两个文本框,输入单价和数量,再用个列表框来记录商品的合计,最终用一个按钮来算出总额就可以了,还需要一个重置按钮来重新开始. 核心 ...
java 基本语法（八）数组（一）数组的概述
* 1.数组的理解:数组(Array),是多个相同类型数据一定顺序排列的集合,并使用一个名字命名, * 并通过编号的方式对这些数据进行统一管理. * * 2.数组相关的概念: * >数组名 * ...
A Mountaineer 最详细的解题报告
题目来源:A Mountaineer (不知道该链接是否可以直接访问,所以将题目复制下来了) 题目如下: D - A Mountaineer Time limit : 2sec / Stack lim ...
基于python的自动化测试简介【十年从业大佬】
一.自动化测试包括以下几个方面: 1. 常用测试工具: (1)QTP:主要用于回归测试和测试同一软件的新版本 (2)Robot Framwork:python编写的功能自动化测试框架,具有良好的可扩展 ...
如何用 Python 做自动化测试【进阶必看】
一.Selenium 环境部署 1. window 环境部署 1.1 当前环境Win10 64 位系统:Python3.6.2(官方已经更新到了 3.6.4) 官方下载地址:https://www.p ...
xss小游戏源码分析
配置下载地址:https://files.cnblogs.com/files/Lmg66/xssgame-master.zip 使用:下载解压,放到www目录下(phpstudy),http服务下都 ...
Centos7安装ftp服务
本文介绍的ftp是可以使用匿名用户登录,且默认路径是根路径,私人使用非常方便,公开使用具有一定的风险,不安全. # .安装 yum install -y vsftpd # .配置 vim /etc/v ...
DJANGO-天天生鲜项目从0到1-010-购物车-购物车操作页面（勾选+删改）
本项目基于B站UP主‘神奇的老黄’的教学视频‘天天生鲜Django项目’,视频讲的非常好,推荐新手观看学习 https://www.bilibili.com/video/BV1vt41147K8?p= ...
正在找工作的同学看过来，zozo最新的java面试题总会，学会月薪3万起！！！
引言为正在找工作的同学提供些许帮助,话不多说直接上题. 关注后私信我[资料]即可免费获取! 关注后私信我[资料]即可免费获取! 关注后私信我[资料]即可免费获取! 关注后私信我[资料]即可免费获取! ...
Linux内存参数
用free -m查看的结果:# free -m total used free shared buffers cachedMem: 50 ...

Kaggle-pandas(1)