1.导入文件,并查看数据样本

abbr = pd.read_csv("./state-abbrevs.csv")
areas =pd.read_csv("./state-areas.csv")
pop = pd.read_csv("./state-population.csv")
display(abbr.head(),areas.head(),pop.head())

abbr:

areas:

pop

2.合并数据,并对数据进行处理。

合并pop和abbr,两个dataframe,并删除合并后的abbreviation列

pop2 = pop.merge(abbr,how="outer",left_on="state/region",right_on="abbreviation")   #设置how,合并后保留全部的数据

pop2.head()  #展示前五条数据

pop2:

pop2.drop(labels="abbreviation",axis=1,inplace=True)     #删除abbreviation的列

判断合并后有空数据

pop2.isnull().any(axis=0)

结果:

可以看到population列和state列中有空数据。

找到‘state’列中那些数据为空,并作为条件。

cond = pop2["state"].isnull()

根据条件判断出那个州有数据为空

cond = pop2["state"].isnull()

结果:array(['PR', 'USA'], dtype=object)

3.对空数据进行填充。

先添加填充条件

cond1 =pop2["state/region"]=="USA"
cond2 = pop2["state/region"]=="PR"

根据条件对为NaN的数数据进行补全
pop2["state"][cond2]="Puerto Rico"
pop2["state"][cond1]="United states"

正之前查询到的空数据的列还有population,对这些空数据进行删除。

cond3 = pop2["population"].isnull()

pop2[cond3].dropna(inplace=True)

pop2.notnull().all()   #然后再对空数据进行查询

结果:

可以看到就没有空数据的列了

对areas表中数据添加到pop2中

pop3 = pop2.merge(areas,how="outer")
pop3.isnull().any()    #判断融合后是否有空数据

结果:

#可以看到area列含有空数据

将有空数据的列作为条件

cond4 = pop3["area (sq. mi)"].isnull()
pop3[cond4]

结果:

#可以看到美国国土总面积数据为空

求出美国国土总面积。并将数据填充到pop3表中

a = areas["area (sq. mi)"].sum ()

pop3.fillna(a,inplace=True)

pop3.isnull().any()

结果:

#可以看到pop3中都没有空数据了

4.求出2010年美国各个州的人口密度

查询2010年各州的人口数据

pop4 = pop3.query("year==2010 and ages =='total'")

pop4.set_index(keys="state",inplace=True)  #给查询出来的数据添加索引,并以州名作为索引。
pop4.tail()

pd.set_option("display.float_format",lambda x:"%0.1f"%(x))
pop_density = pop4["population"]/pop4["area (sq. mi)"]
pop_density1 = DataFrame(pop_density,columns=["pop_density(pop/area)"])
pop_density1.tail()
pop5 = pop4.merge(pop_density1,on="state")
pop5.head()

# 排序找到人口密度最高的五个州
pop6 = pop5.sort_values(by="pop_density(pop/area)",ascending=False)
pop6.head()

pandas实践——美国人口分析的更多相关文章

  1. pandas实例美国人口分析

  2. Python 的 pandas 实践

    Python 的 pandas 实践: # !/usr/bin/env python # encoding: utf-8 __author__ = 'Administrator' import pan ...

  3. pandas - 案例(美国各州人口普查)

    需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些state/region使得state的值为N ...

  4. pandas - 案例(美国2012年总统候选人政治献金数据分析)

    # 提供数据 months = {'JAN' : 1, 'FEB' : 2, 'MAR' : 3, 'APR' : 4, 'MAY' : 5, 'JUN' : 6, 'JUL' : 7, 'AUG' ...

  5. Python之numpy,pandas实践

    Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言. Jupyter Notebook 的本质是一个 Web 应用程序,便 ...

  6. pandas之美国2012年总统候选人政治献金数据分析

  7. 数据分析实际案例之:pandas在餐厅评分数据中的使用

    目录 简介 餐厅评分数据简介 分析评分数据 简介 为了更好的熟练掌握pandas在实际数据分析中的应用,今天我们再介绍一下怎么使用pandas做美国餐厅评分数据的分析. 餐厅评分数据简介 数据的来源是 ...

  8. python 全栈之路

    目录 Python 全栈之路 一. Python 1. Python基础知识部分 2. Python -函数 3. Python - 模块 4. Python - 面对对象 5. Python - 文 ...

  9. 数据分析06 /pandas高级操作相关案例:人口案例分析、2012美国大选献金项目数据分析

    数据分析06 /pandas高级操作相关案例:人口案例分析.2012美国大选献金项目数据分析 目录 数据分析06 /pandas高级操作相关案例:人口案例分析.2012美国大选献金项目数据分析 1. ...

随机推荐

  1. jsp学习与提高(五)——JSP 异常处理

    JSP 异常处理 当编写JSP程序的时候,程序员可能会遗漏一些BUG,这些BUG可能会出现在程序的任何地方.JSP代码中通常有以下几类异常: 检查型异常:检查型异常就是一个典型的用户错误或者一个程序员 ...

  2. 047 Permutations II 有重复数字的全排列

    给定一个可能包含重复数字的集合,返回所有可能的不同全排列.例如,[1,1,2] 有以下不同全排列:[  [1,1,2],  [1,2,1],  [2,1,1]] 详见:https://leetcode ...

  3. PostgreSQL 导出导入表中指定查询数据

    创建一临时表: create table test_view as select * from test where date(to_timestamp(endtime))>='2012-09- ...

  4. C. An impassioned circulation of affection DP

    http://codeforces.com/contest/814/problem/C 12ooyomioomioo21 o2 o 这题我是用dp解的,不过好像很慢,比赛的时候算了下不会mle,就没滚 ...

  5. CellSet 遍历

    CellSet 结构: 查询MDX: SELECT NON EMPTY {{ {{ {{ {{ {{ AddCalculatedMembers([店铺.店铺ID].[店铺ID].Members)}} ...

  6. 开园了,将以此记录个人web前端之路

    记录.分享与学习 2015年5月中旬开始学习web前端到2015年6月底找到第一份相关工作,在学习与工作过程中通过网络获益良多,在此写下个人学习与工作过程中的总结与思考,记录个人成长,同时也希望能够帮 ...

  7. 【转】ibatis 中使用select top #pagesize# * from tablename

    ibatis中使用select top #num# * from tableName出现错误.由于初次用ibatis还不知道在它里边拼写SQL语句的一些规则,导致一些自认为很平常的SQL语句,在它这里 ...

  8. BroadCast广播机制应用与实例

    如何编写广播接收器 第一步:需要继承BroadcastReceiver类,覆写其中的onReceive()方法. class MyBroadcastReceiver extends Broadcast ...

  9. nodejs学习8:windows连接mongodb出现的错误解决办法

    今天遇到了在windows下连接mongodb错误的情况,因为之前安装是正常的,而重启的电脑之后就再也连接不上.于是在群里求助了下,无果,查阅了官网的英文文档,终于有些眉目了,故此一记. 先吐槽下命令 ...

  10. Kendo MVVM 数据绑定(十一) Value

    Kendo MVVM 数据绑定(十一) Value Value 绑定可以把 ViewModel 的某个属性绑定到 DOM 元素或某个 UI 组件的 Value 属性.当用户修改 DOM 元素或 UI ...