Python数据科学手册(1) IPython:超越Python
1.1 shell还是Notebook
Jupyter Notebook 是 IPython shell 基于浏览器的图形界面,提供了一系列丰富的动态展示功能。Jupyter Notebook 不仅可以执行 Python/IPython 语句,还允许用户添加格式化文本、静态和动态的可视化图像、数学公式、JavaScript 插件,等等。不仅如此,这些 Notebook 文档还能以共享方式存储,以便其他人可以打开这些 Notebook,并且在他们自己的系统中执行这些 Notebook 代码。
> jupyter notebook
1.2 IPython的帮助和文档
符号 ? 用于浏览文档,符号 ?? 用于浏览源代码,而 Tab 键可以用于自动补全。
每一个 Python 对象都有一个字符串的引用,该字符串即 docstring。大多数情况下,该字符串包含对象的简要介绍和使用方法。
help(len)
Help on built-in function len in module builtins: len(obj, /)
Return the number of items in a container.
len?
Signature: len(obj, /)
Docstring: Return the number of items in a container.
Type: builtin_function_or_method
这种方法也适用于你自己创建的函数或者其他对象!
def square(a):
"""Return the square of a."""
return a ** 2 square?
Signature: square(a)
Docstring: Return the square of a.
Type: function
square??
Signature: square(a)
Source:
def square(a):
"""Return the square of a."""
return a ** 2
Type: function
有时 ?? 不能显示源代码。这是因为该对象并不是用 Python 实现的,而是用 C 语言或其他编译扩展语言实现的。在这种情况下,?? 后缀将等同于 ? 后缀。
使用TAB补全对象或命令。


使用TAB可以查看系统中可导入的包或者包中可导入的对象。


使用*进行通配符匹配。
str.*find*?
str.find
str.rfind *Warning?
BytesWarning
DeprecationWarning
FutureWarning
ImportWarning
PendingDeprecationWarning
ResourceWarning
RuntimeWarning
SyntaxWarning
UnicodeWarning
UserWarning
Warning
1.3 快捷键
用上下方向键查找历史,如果输入 def 然后按下上方向键,则会在命令历史中找到以 def 开头的最近的命令(如果有的话)。
- Ctrl + a 将光标移到本行的开始处
- Ctrl + e 将光标移到本行的结尾处
- Ctrl + l 清除终端屏幕的内容
- Ctrl + c 中断正在执行的 Python 命令
- Ctrl + d 退出当前 IPython 会话
1.4 IPython魔法命令
魔法命令有两种形式:行魔法(line magic)和单元魔法(cell magic)。行魔法以单个 % 字符作为前缀,作用于单行输入;单元魔法以两个 %% 作为前缀,作用于多行输入。
- %paste:将剪切板中的代码完整粘贴并且自动执行代码输入结果。
%paste
def f(x, y, z):
return (x+y)/z
a = 5
b = 6
c = 7
result = f(a, b, c)
print(result) ## -- End pasted text --
1.5714285714285714
- %cpaste也是粘贴文本的,可以粘贴任何一条代码,在输入结束命令之前都不会执行代码,输入‘--’按回车或者使用‘Ctrl-D’停止粘贴代码,停止粘贴代码后会执行代码。
- %run myscript.py:执行脚本内容,或者使用runfile命令。
#-------------------------------------
# file: myscript.py
def square(x):
"""求平方"""
return x ** 2
for N in range(1, 4):
print(N, "squared is", square(N))

- %timeit:计算一行Python语句执行的时间。
%timeit L = [n ** 2 for n in range(1000)]
416 µs ± 58.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
- 对于多行语句,可以加入第二个 % 符号将其转变成单元魔法,以处理多行输入。
- %reset:指删除interactive命名空间中全部的变量名。

- %xdel variable:删除单个变量的引用。

- %magic:获取可用魔法函数的通用描述以及一些示例。
- %lsmagic:获取所有魔法函数的列表。
1.5 输入和输出历史
In[1]:/Out[1]:给出了在当前会话中如何获取输入和输出历史的线索。
In 对象是一个列表,按照顺序记录所有的命令(列表中的第一项是一个占位符,以便 In[1] 可以表示第一条命令)。
Out 对象不是一个列表,而是一个字典。它将输入数字映射到相应的输出(如果有的话)。
任何返回值是 None 的命令都不会加到 Out 变量中。

变量 _(单下划线)用于更新以前的输出,双下划线获得倒数第二个历史输出,三下划线获得倒数第三个历史输出,仅止于此。
Out[X]的简写是_X。

要禁止一个命令的输出,最简单的方式就是在行末尾处添加一个分号。
使用%history魔法命令输出历史记录。

1.6 IPython和shell命令
使用 ! 符号作为前缀在 IPython 中执行任何shell命令行命令。

shell 命令不仅可以从 IPython 中调用,还可以和 IPython 命名空间进行交互。通过一个赋值操纵符可以将任何 shell 命令的输出保存到 Python 中。
需要注意的是这些结果并不以列表的形式返回,而是以 IPython 中定义的一个特殊 shell 返回类型的形式返回。这看上去和 Python 列表很像,并且可以像列表一样操作。但是这种类型还有其他功能,例如 grep 和 fields 方法以及 s、n 和 p 属性,允许我们轻松地搜索、过滤和显示结果。

1.7 与shell相关的魔法命令
自动魔法(automagic)函数:%cd、%cat、%cp、%env、%ls、%man、%mkdir、%more、%mv、%pwd、%rm 和 %rmdir。如果 automagic 被打开,以上任何一个魔法命令都可以省略 % 符号,这使得 IPython 提示符可以被当做当作普通 shell 一样使用。

1.8 错误和调试
改变错误打印信息:
- %xmode Context:普通(默认)。
- %xmode Plain:更加紧凑。
- %xmode Verbose:加入了一些额外的信息,包括任何被调用的函数的参数。
使用%debug开启调试模式。

使用%pbd函数在发生错误时自动打开调试界面。
使用%run -d交互式地运行脚本。
1.9 代码的分析和计时
- %time:对单个语句的执行时间进行计时。
- %timeit:对单个语句的重复执行进行计时,以获得更高的准确度。
有时候重复一个操作并不是最佳选择。例如,如果有一个列表需要排序,我们可能会被重复操作误导。对一个预先排好序的列表进行排序,比对一个无序的列表进行排序要快,所以重复运行将使结果出现偏差,对于这种情况,%time 魔法函数可能是更好的选择。
- %prun:利用分析器运行代码。
- %lprun:利用逐行分析器运行代码。
- %memit:测量单个语句的内存使用。
- %mprun:通过逐行的内存分析器运行代码。

Python数据科学手册(1) IPython:超越Python的更多相关文章
- 《Python数据科学手册》
<Python数据科学手册>[美]Jake VanderPlas著 陶俊杰译 Absorb what is useful, discard what is not, and add wh ...
- Python数据科学手册-前言
读Python数据科学手册 笔记 系列 数据科学 data science https://img2022.cnblogs.com/blog/2827305/202205/2827305-202205 ...
- Python数据科学手册
Python数据科学手册(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1KurSdjNWiwMac3o3iLrzBg 提取码:qogy 复制这段内容后打开百度网盘手 ...
- 100天搞定机器学习|day45-53 推荐一本豆瓣评分9.3的书:《Python数据科学手册》
<Python数据科学手册>共五章,每章介绍一到两个Python数据科学中的重点工具包.首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境:第2章讲解能提供nda ...
- Matplotlib 使用 - 《Python 数据科学手册》学习笔记
一.引入 import matplotlib as mpl import matplotlib.pyplot as plt 二.配置 1.画图接口 Matplotlib 有两种画图接口: (1)一个是 ...
- 《Python数据科学手册》第五章机器学习的笔记
目录 <Python数据科学手册>第五章机器学习的笔记 0. 写在前面 1. 判定系数 2. 朴素贝叶斯 3. 自举重采样方法 4. 白化 5. 机器学习章节总结 <Python数据 ...
- Python数据科学手册Seaborn马拉松可视化里时分秒转化为秒数的问题
Python数据科学手册Seaborn马拉松可视化里时分秒转化为秒数的问题 问题描述: 我实在是太懒了,问题描述抄的网上的哈哈哈:https://www.jianshu.com/p/6ab7afa05 ...
- 学习《Python数据科学手册》高清中文PDF+高清英文PDF+代码
如果有一定的数据分析与机器学习理论与实践基础,<Python数据科学手册>这本书是绝佳选择. 是对以数据深度需求为中心的科学.研究以及针对计算和统计方法的参考书.很友好实用,结构很清晰.但 ...
- python书籍推荐:Python数据科学手册
所属网站分类: 资源下载 > python电子书 作者:today 链接:http://www.pythonheidong.com/blog/article/448/ 来源:python黑洞网 ...
- Python数据科学手册(2) NumPy入门
NumPy(Numerical Python 的简称)提供了高效存储和操作密集数据缓存的接口.在某些方面,NumPy 数组与 Python 内置的列表类型非常相似.但是随着数组在维度上变大,NumPy ...
随机推荐
- centos 6.* 修改时间
一.查看Centos的时区和时间 1.使用date命令查看Centos时区 [root@VM_centos ~]# date -R Mon, 26 Mar 2018 19:14:03 +0800 2. ...
- 无标定量|有标定量|谱图计数|XIC|AMT数据库|RT对对齐|母离子|子离子|SILVER|SRM|iBAQ|APEX|差异蛋白筛选|MaxQuant|PANDA|C-HPP
生物医学大数据-蛋白质定量 现今肽段定量效率存在巨大差异.比如相同质量蛋白质,但是肽段和蛋白信号不均一,在物理条件一致时,仅有70%的重复率,并且当重复次数变多时,overlapping在变少. 无标 ...
- 领域驱动(DDD)之我见,基于Golang实现
分享一点不成熟的理解,还请本着交流进步的大原则喷之.从去年开始接触和套用DDD以来,已经有1年多时间了.也先后在2个生产项目中主导应用. 一.一些概念 DDD经典分层: 分层架构的一个重要原则是:每层 ...
- Archives: 2013/6
OpenStack环境搭建 这一步有两个选择: 一种就是正统的真实搭建,所有都按生产环境来部署,费时费力. 还有一种就是官方推荐的一键安装DevStack,直接安装最新的版本,体验最新的特性. 至于如 ...
- npm镜像源
1.国内用户,建议将npm的注册表源设置为国内的镜像,可以大幅提升安装速度,先查看本机地址 npm config get registry 2.国内优秀npm镜像推荐及使用 淘宝npm镜像 ·搜索地址 ...
- 吴裕雄--天生自然HTML学习笔记:HTML 表单和输入
HTML 表单用于收集不同类型的用户输入. <!DOCTYPE html> <html> <head> <meta charset="utf-8& ...
- 在shell下执行命令的方法
在shell下执行命令的方法 1. #!/bin/sh 语法:在shell.sh的开头写入 #!/bin/sh 一般的shell脚本就是这种用法.这种方法调用脚本开头的shell执行命令,子shell ...
- 基于Springboot注解的策略模式
释义 策略模式和多态很相似 可以理解为定义了一个统一的接口,有许多不同的实现类,可以自由选择不同的实时类去执行. 实现 上代码: 定义一个统一的接口: [JavaScript] 纯文本查看 复制代码 ...
- 三分钟学会使用Derby数据库
Derby数据库是一个纯用Java实现的内存数据库,属于Apache的一个开源项目.由于是用Java实现的,所以可以在任何平台上运行:另外一个特点是体积小,免安装,java1.6开始集成了derby数 ...
- 文本快速分类利器fasttext使用心得(踩坑之路)
fasttext是文本分类的一大利器,优点:快,嗷嗷快:缺点:暂未发现.但是我在使用其做文本分类时候还是遇到了挺多坑,今天先总结一个: 网上有人说设置训练参数的时候,ngrams设置大于2可以提高模型 ...