Python数据分析开发环境
准备工作
下载并安装最新版本的Anaconda
下载并安装最新版本的Visual Studio Code
编辑器
Tips:
可以选择自己喜欢并且熟悉的编辑器或IDE。如:VIM、Emacs、Notepad++、Sublime、Pycharm等。
如果安装的是完整版本的Anaconda,会默认安装Spyder以及Jupyter Notebook。那么不想折腾编辑器的话,推荐使用这两款应用是足够的。
Visual Studio Code
推荐插件
- Python
可选插件
- vscode-icons
包管理器选择
Conda
Conda是目前比较常用的包管理工具,其大致功用于pip类似,这里使用Conda的原因,主要在于Conda除可以安装python的包外,还可以很方便的安装其他变成语言的包(如C++、C等)。这样的话,就可以很方便的解决有些数据分析的包依赖非python编写的程序包的问题。
为了能够直接在命令行中使用conda命令,这里将
Anaconda3\Scripts目录添加到了环境变量中。
基本使用
创建虚拟环境:conda create -n <env_name> python=<python_version_num>
激活虚拟环境:activate <env_name>
安装程序包到指定虚拟环境:conda install -n <env_name> <pakcage_name>
关闭虚拟环境:deactivate
删除虚拟环境:conda remove <env_name> --all
删除虚拟环境中的某个包:conda remove --name <env_name> <package_name>
查看已安装包:conda list
查看已安装环境:conda env list
检查更新conda:conda update conda
更新所有程序包:conda update --all
常用包安装
安装好Anaconda后,可以使用Anaconda来管理包的安装。
如果是用于学习与研究,而不用与其他人协作或者能够有良好的约定的话,那么可以直接使用conda的默认的环境,这样就可以少安装很多包。
REM 基础包
conda install numpy
conda install scipy
conda install pandas
conda install matplotlib
REM ORM,用于连接数据库
conda install sqlalchemy
更改Conda的下载镜像
如果要使用的包并不包含在默认的conda环境中,又想加快下载速度与稳定性的话,可以添加国内的下载镜像。
在终端中执行以下命令:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
参考:
PIP
因为某些原因使用Conda可能无法顺利安装一些包,那么可以使用PIP来进行安装。
REM 更新PIP
python -m pip install --upgrade pip
REM 中国股票数据获取
pip install tushare
REM 导出当前环境所有依赖包信息
pip freeze > requirements.txt
REM 根据导出的依赖包信息安装包
pip install -r requirements.txt -d <your_download_dir>
常用包推荐
数据获取&爬虫
- Tushare:提供便捷的国内股票行情数据的获取(自动爬取相关网站数据)
- requests:一款优秀的HTTP Request包,可以用于与HTML/XML解析的包结合起来制作爬虫工具。
- urllib:Python3的内置包,主要用于访问、解析指定URL。
- Beautiful Soup:一个可以从HTML或XML文件中提取数据的Python库。
数据整理
- Numpy:提供强大的矩阵操作,以及一些非常有用的计算工具(如:irr、npv等)
- Pandas:提供强大的数据框操作(类似R语言中的DataFrame)
- SciPy:提供强大的统计工具。
数据可视化
数据库操作
- sqlalchemy:数据库建议使用自己熟悉的或项目统一要求的,如:Oracle、MySQL、PostgreSQL、MSSQL、SQLite等。
sqlalchemy包可以有效的连接各类常用的数据库,并处理各类操作。
Python数据分析开发环境的更多相关文章
- 在MAC上搭建python数据分析开发环境
最近工作转型到数据开发领域,想在本地搭建一个数据开发环境.自己有三年python开发经验,马上想到使用numpy.scipy.sklearn.pandas搭建一套数据开发环境. ubuntu的环境,百 ...
- 【转】windows和linux中搭建python集成开发环境IDE
本系列分为两篇: 1.[转]windows和linux中搭建python集成开发环境IDE 2.[转]linux和windows下安装python集成开发环境及其python包 3.windows和l ...
- windows和linux在建筑python集成开发环境IDE
http://blog.csdn.net/pipisorry/article/details/39854707 使用的系统及软件 Ubuntu / windows Python 2.7 / pytho ...
- 【Python开发】python集成开发环境IDE搭建
http://blog.csdn.net/pipisorry/article/details/39854707 使用的系统及软件 Ubuntu / windows Python 2.7 / pytho ...
- windows和linux中搭建python集成开发环境IDE——如何设置多个python环境
本系列分为两篇: 1.[转]windows和linux中搭建python集成开发环境IDE 2.[转]linux和windows下安装python集成开发环境及其python包 3.windows和l ...
- 【转】linux和windows下安装python集成开发环境及其python包
本系列分为两篇: 1.[转]windows和linux中搭建python集成开发环境IDE 2.[转]linux和windows下安装python集成开发环境及其python包 3.windows和l ...
- Python虚拟开发环境
最近,一直在不同版本的Python之间来回折腾,发现了几个Python虚拟开发环境工具,具体如下: 1. Virtualenv,可以指定开发环境的Python版本.继承已有开发环境配置,virtual ...
- [转]virtualenv建立多个Python独立开发环境
不同的人喜欢用不同的方式建立各自的开发环境,但在几乎所有的编程社区,总有一个(或一个以上)开发环境让人更容易接受. 使用不同的开发环境虽然没有什么错误,但有些环境设置更容易进行便利的测试,并做一些重复 ...
- 西秦的ACE-Python教程 一、Python本地开发环境部署
西秦的ACE-Python教程 一.Python本地开发环境部署 西秦 级别: 论坛版主 发帖 1357 云币 2782 加关注 写私信 只看楼主 更多操作楼主 发表于: 10-10 ...
随机推荐
- 404 Note Found 队-Alpha10
目录 组员情况 组员1(组长):胡绪佩 组员2:胡青元 组员3:庄卉 组员4:家灿 组员5:凯琳 组员6:翟丹丹 组员7:何家伟 组员8:政演 组员9:黄鸿杰 组员10:刘一好 组员11:何宇恒 展示 ...
- 我的QT5学习之路(四)——信号槽
一.前言 前面说了Qt最基本的实例创建.控件以及工具集的介绍,相当于对于Qt有了一个初次的认识,这次我们开始认识Qt信号通信的重点之一——信号槽. 二.信号槽 信号槽是 Qt 框架引以为豪的机制之一. ...
- Linux Shell常用技巧(十一)
二十二. 交互式使用Bash Shell: 1. 用set命令设置bash的选项: 下面为set主要选项的列表及其表述: 选项名 开关缩写 描述 allexport -a 打开此开关, ...
- Linux Shell常用技巧(十)
二十. 通过管道组合Shell命令获取系统运行数据: 1. 输出当前系统中占用内存最多的5条命令: #1) 通过ps命令列出当前主机正在运行的所有进程. #2) 按照第五个字段基于数值 ...
- MongoDB常用指令
db 查看当前操作的数据库 show dbs 显示所有数据库 show collections 显示当前数据库下的所有集合 use database_name 连接到一个名叫[database_nam ...
- 利用PDCA工具改进周例会
PDCA简介 PDCA循环又叫戴明环,是美国质量管理专家休哈特博士首先提出的,由戴明采纳.宣传,获得普及,从而也被称为“戴明环”. PDCA最早用来解决全面质量管理问题,但是PDCA也可以用来作为一个 ...
- Linux-- 查看文件 more与其它
more 翻页查看 用法:more 文件名 nl 显示行号打印(不常用) 1.不打印空白行行号:nl -b t 文件名 类似 cat -b 文件名 2.打印所有行行号:nl -b a 文件名 类似 c ...
- Python中级 —— 06SMTP发送电子邮件
Email的历史比Web还要久远,直到现在,Email也是互联网上应用非常广泛的服务.(未完)
- ThinkPHP5.1 前置操作说明
可以为某个或者某些操作指定前置执行的操作方法,设置 beforeActionList属性可以指定某个方法为其他方法的前置操作,数组键名为需要调用的前置方法名,无值的话为当前控制器下所有方法的前置方法. ...
- PHP结合zyupload多功能图片上传实例
PHP结合zyupload多功能图片上传实例,支持拖拽和裁剪.可以自定义高度和宽度,类型,远程上传地址等. zyupload上传基本配置 $("#zyupload").zyUplo ...