"利用python进行数据分析"学习记录

--day01 08/02

与书相关的资料在 http://github.com/wesm/pydata-book

pandas 的2名字来源是 pannel data

安装python的包

  • conda install package_name
  • pip install package_name

更新python的包

  • conda update package_name
  • pip install --upgraade package_name

我觉得conda好用多了,能用conda绝对不用原生

jupyter

  • 代码输入到In区,在按shift + enter
  • 输出结果展现在out区

导入约定

  • puthon 社区对一些常用模块进行了命名的约定

    • import numpy as np
      import matplotlib.pyplot as plt
      import pandas as pd
      import seaborn as sns
      import statsmodels as sm
    • 故np.arrange 是用的是NumPy中的arrange函数

伪代码

  • 类代码,事实上不是实际有效的源代码

处理/处置/规整(munge/munging/wrangling)

  • 将非结构化的或者同时又很凌乱的数据整理成结构化、清晰形式的整个过程

内省

  • 直接在jupyter notebook 中的In [n]:行中打?、??
    • ?一个打印类型,两个打印源代码

munge

[ muhnj ]


verb (used with or without object), munged, mung·ing. Computer Slang.

to manipulate (raw data), especially to convert (data) from one format to another:the munging of HTML content.

grunge

[ gruhnj ]


noun Slang.

dirt; filth; rubbish.

something of inferior quality; trash:He didn't know good music from grunge.

a person who works hard, usually for meager rewards; grind.

a style or fashion derived from a movement in rock music: in fashion characterized by unkempt clothing and in music by aggressive, nihilistic songs.

wrangle

[ rang-guhl ]SHOW IPA


verb (used without object), wran·gled, wran·gling.

to argue or dispute, especially in a noisy or angry manner.

verb (used with object), wran·gled, wran·gling.

to argue or dispute.

to tend or round up (cattle, horses, or other livestock).

to obtain, often by contrivance or scheming; wangle:He wrangled a job through a friend.

noun

a noisy or angry dispute; altercation.

上文的wangling指的是通过权宜或计划获得

错误收集

In [1]:def add_number(a,b):

shift + enter

SyntaxError: unexpected EOF while parsing

EOF是一个计算机术语,为End Of File的缩写,在操作系统中表示资料源无更多的资料可读取。 资料源通常称为档案或串流。 通常在文本的最后存在此字符表示资料结束。

  • 没有正经结尾

"利用python进行数据分析"学习记录01的更多相关文章

  1. Python: 利用Python进行数据分析 学习记录

    -----15:18 2016/10/14----- 1. import numpy as np;import pandas as pd values = pd.Series(np.random.no ...

  2. 利用python进行数据分析—数据清洗记录3,map,apply,

      社会心态调查报告 导语: 时代决定心态,心态映照时代.社会心态产生于社会个体心理,又以整体的形态存在,进而影响着每个社会成员的社会价值取向和行为方式,影响着国家经济政治和社会发展大局.良好的社会心 ...

  3. $《利用Python进行数据分析》学习笔记系列——IPython

    本文主要介绍IPython这样一个交互工具的基本用法. 1. 简介 IPython是<利用Python进行数据分析>一书中主要用到的Python开发环境,简单来说是对原生python交互环 ...

  4. PYTHON学习(三)之利用python进行数据分析(1)---准备工作

    学习一门语言就是不断实践,python是目前用于数据分析最流行的语言,我最近买了本书<利用python进行数据分析>(Wes McKinney著),还去图书馆借了本<Python数据 ...

  5. 利用python进行数据分析——(一)库的学习

    总结一下自己对python常用包:Numpy,Pandas,Matplotlib,Scipy,Scikit-learn 一. Numpy: 标准安装的Python中用列表(list)保存一组值,可以用 ...

  6. 利用python进行数据分析--(阅读笔记一)

    以此记录阅读和学习<利用Python进行数据分析>这本书中的觉得重要的点! 第一章:准备工作 1.一组新闻文章可以被处理为一张词频表,这张词频表可以用于情感分析. 2.大多数软件是由两部分 ...

  7. 利用Python进行数据分析-Pandas(第一部分)

    利用Python进行数据分析-Pandas: 在Pandas库中最重要的两个数据类型,分别是Series和DataFrame.如下的内容主要围绕这两个方面展开叙述! 在进行数据分析时,我们知道有两个基 ...

  8. 利用Python进行数据分析

    最近在阅读<利用Python进行数据分析>,本篇博文作为读书笔记 ,记录一下阅读书签和实践心得. 准备工作 python环境配置好了,可以参见我之前的博文<基于Python的数据分析 ...

  9. 利用Python进行数据分析(第二版)电子版书籍分享

    资料下载地址: 链接:https://pan.baidu.com/s/1y1C0bJPkSn7Sv6Eq9G5_Ug 提取码:vscu <利用Python进行数据分析(第二版)>高清中文版 ...

随机推荐

  1. linux 信号 ctrl + d z c fg bg 作用

    ctrl+c:前台进程终止 后台进程的终止: 方法一:通过jobs命令查看job号(假设为num),然后执行kill %num   $ kill %1 方法二:通过ps命令查看job的进程号(PID, ...

  2. OpenCV之图像归一化(normalize)

    什么图像归一化 通俗地讲就是将矩阵的值通过某种方式变到某一个区间内 图像归一化的作用 目前能理解的就是归一化到某个区间便于处理,希望高人可以指点 opencv文档中的介绍 C++: void norm ...

  3. Makefile 指定源文件目录 make

    top=$(CURDIR) SRC_DIR=$(top)/src BUILD_DIR=$(SRC_DIR) src=$(wildcard $(SRC_DIR)/*.c) obj=$(patsubst ...

  4. ssh2中的添,删,查,改。

    1.spring封装的HibernateTemplate类的一些操作方法. 2.session提供的根据主键ID进行添.删.查.改的基本方法. 由session得到的hql语句 由session得到的 ...

  5. rgw的rgw_thread_pool_size配置调整

    前言 在比对rgw的不同前端的区别的时候,官方说civetweb是通过线程池来控制连接的,beast是后面加入了流控相关的,这块一直也没有调整过相关的参数,然后通过ab压测了一下,还是有很明显的区别的 ...

  6. 转载 数据库优化 - SQL优化

    判断问题SQL判断SQL是否有问题时可以通过两个表象进行判断: 系统级别表象CPU消耗严重IO等待严重页面响应时间过长应用的日志出现超时等错误可以使用sar命令,top命令查看当前系统状态. 也可以通 ...

  7. 这 5 个开源的能挣钱的 SpringBoot 项目,真TMD香!

    不得不佩服 Spring Boot 的生态如此强大,今天我给大家推荐几款 Gitee 上优秀的后台开源版本的管理系统,小伙伴们再也不用从头到尾撸一个项目了,简直就是接私活,挣钱的利器啊. SmartA ...

  8. 【C++】递归之二分查找

    简单查找的时间复杂度为O(n) 二分查找的时间复杂度为O(logn) 用递归实现二分查找: 基线条件:数组只包含一个元素.如果如果要查找的值与这个元素相同,就找到了:否则说明不在数组中. 递归条件:把 ...

  9. HotSpot类模型之ArrayKlass

    上一篇分析了 HotSpot类模型之InstanceKlass ,这次主要分析表示java数组类型的C++类. 1.ArrayKlass类 ArrayKlass继承自Klass,是所有数组类的抽象基类 ...

  10. powershell过杀软工具-xencrypt

           在红队攻击中,绕杀软是一个比较常见的技术.对于绕过杀软的方法,有基于黑白名单的,有基于shellloader的,也有基于加密与混淆的.最近在发现了这样一款过杀软的工具,推荐给有缘人,嘻嘻 ...