准备工作

下载并安装最新版本的Anaconda

下载并安装最新版本的Visual Studio Code

编辑器

Tips:

可以选择自己喜欢并且熟悉的编辑器或IDE。如:VIM、Emacs、Notepad++、Sublime、Pycharm等。

如果安装的是完整版本的Anaconda,会默认安装Spyder以及Jupyter Notebook。那么不想折腾编辑器的话,推荐使用这两款应用是足够的。

Visual Studio Code

推荐插件

  • Python

可选插件

  • vscode-icons

包管理器选择

Conda

Conda是目前比较常用的包管理工具,其大致功用于pip类似,这里使用Conda的原因,主要在于Conda除可以安装python的包外,还可以很方便的安装其他变成语言的包(如C++、C等)。这样的话,就可以很方便的解决有些数据分析的包依赖非python编写的程序包的问题。

为了能够直接在命令行中使用conda命令,这里将Anaconda3\Scripts目录添加到了环境变量中。

基本使用

创建虚拟环境:conda create -n <env_name> python=<python_version_num>

激活虚拟环境:activate <env_name>

安装程序包到指定虚拟环境:conda install -n <env_name> <pakcage_name>

关闭虚拟环境:deactivate

删除虚拟环境:conda remove <env_name> --all

删除虚拟环境中的某个包:conda remove --name <env_name> <package_name>

查看已安装包:conda list

查看已安装环境:conda env list

检查更新conda:conda update conda

更新所有程序包:conda update --all

常用包安装

安装好Anaconda后,可以使用Anaconda来管理包的安装。

如果是用于学习与研究,而不用与其他人协作或者能够有良好的约定的话,那么可以直接使用conda的默认的环境,这样就可以少安装很多包。


REM 基础包 conda install numpy
conda install scipy
conda install pandas
conda install matplotlib REM ORM,用于连接数据库 conda install sqlalchemy

更改Conda的下载镜像

如果要使用的包并不包含在默认的conda环境中,又想加快下载速度与稳定性的话,可以添加国内的下载镜像。

在终端中执行以下命令:


conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes

参考:

  1. Anaconda 镜像使用帮助

PIP

因为某些原因使用Conda可能无法顺利安装一些包,那么可以使用PIP来进行安装。


REM 更新PIP python -m pip install --upgrade pip REM 中国股票数据获取 pip install tushare REM 导出当前环境所有依赖包信息 pip freeze > requirements.txt REM 根据导出的依赖包信息安装包 pip install -r requirements.txt -d <your_download_dir>

常用包推荐

数据获取&爬虫

  • Tushare:提供便捷的国内股票行情数据的获取(自动爬取相关网站数据)
  • requests:一款优秀的HTTP Request包,可以用于与HTML/XML解析的包结合起来制作爬虫工具。
  • urllib:Python3的内置包,主要用于访问、解析指定URL。
  • Beautiful Soup:一个可以从HTML或XML文件中提取数据的Python库。

数据整理

  • Numpy:提供强大的矩阵操作,以及一些非常有用的计算工具(如:irr、npv等)
  • Pandas:提供强大的数据框操作(类似R语言中的DataFrame)
  • SciPy:提供强大的统计工具。

数据可视化

数据库操作

  • sqlalchemy:数据库建议使用自己熟悉的或项目统一要求的,如:Oracle、MySQL、PostgreSQL、MSSQL、SQLite等。sqlalchemy包可以有效的连接各类常用的数据库,并处理各类操作。

Python数据分析开发环境的更多相关文章

  1. 在MAC上搭建python数据分析开发环境

    最近工作转型到数据开发领域,想在本地搭建一个数据开发环境.自己有三年python开发经验,马上想到使用numpy.scipy.sklearn.pandas搭建一套数据开发环境. ubuntu的环境,百 ...

  2. 【转】windows和linux中搭建python集成开发环境IDE

    本系列分为两篇: 1.[转]windows和linux中搭建python集成开发环境IDE 2.[转]linux和windows下安装python集成开发环境及其python包 3.windows和l ...

  3. windows和linux在建筑python集成开发环境IDE

    http://blog.csdn.net/pipisorry/article/details/39854707 使用的系统及软件 Ubuntu / windows Python 2.7 / pytho ...

  4. 【Python开发】python集成开发环境IDE搭建

    http://blog.csdn.net/pipisorry/article/details/39854707 使用的系统及软件 Ubuntu / windows Python 2.7 / pytho ...

  5. windows和linux中搭建python集成开发环境IDE——如何设置多个python环境

    本系列分为两篇: 1.[转]windows和linux中搭建python集成开发环境IDE 2.[转]linux和windows下安装python集成开发环境及其python包 3.windows和l ...

  6. 【转】linux和windows下安装python集成开发环境及其python包

    本系列分为两篇: 1.[转]windows和linux中搭建python集成开发环境IDE 2.[转]linux和windows下安装python集成开发环境及其python包 3.windows和l ...

  7. Python虚拟开发环境

    最近,一直在不同版本的Python之间来回折腾,发现了几个Python虚拟开发环境工具,具体如下: 1. Virtualenv,可以指定开发环境的Python版本.继承已有开发环境配置,virtual ...

  8. [转]virtualenv建立多个Python独立开发环境

    不同的人喜欢用不同的方式建立各自的开发环境,但在几乎所有的编程社区,总有一个(或一个以上)开发环境让人更容易接受. 使用不同的开发环境虽然没有什么错误,但有些环境设置更容易进行便利的测试,并做一些重复 ...

  9. 西秦的ACE-Python教程 一、Python本地开发环境部署

    西秦的ACE-Python教程 一.Python本地开发环境部署       西秦 级别: 论坛版主 发帖 1357 云币 2782 加关注 写私信   只看楼主 更多操作楼主  发表于: 10-10 ...

随机推荐

  1. 随手练——USACO 1.44 母亲的牛奶

    P1215 [USACO1.4]母亲的牛奶 Mother's Milk 洛谷 P1215:https://www.luogu.org/problemnew/show/P1215 解题思想:DFS 大一 ...

  2. [19/04/16-星期二] 注解机制(Annotation,区别于comment(传统意义上的注释))

    一.概念 作用: ——不是程序本身,可以对程序作出解释.(这一点和注释没什么区别) ——可以被其它程序(比如编译器)读取,这是区别于注释的最重要的一点. 格式: ——"@注释名" ...

  3. 推荐一个配置linux服务的网站

    该网站的各种linux服务的配置都是基于CentOS系统的 基本上各种linux服务都有了 http://www.server-world.info/en/

  4. .Net Core应用程序发布时不同方式的差别

    .Net Core的文档更新的真是快..每次看的时候都觉得之前是不是梦游看的...每次发布应用程序的时候都要翻看下文档..至少rid是死活记不住.还是留个RID的索引吧..还有发布的索引 ,这样就好复 ...

  5. web性能优化之GZIP压缩

    从服务端优化来说,通过对服务端做压缩配置可以大大减小文本文件的体积,从而使加载文本的速度成倍的加快.目前比较通用的压缩方法是启用gzip压缩.它会把浏览器请求的页面,以及页面中引用的静态资源以压缩包的 ...

  6. 怎么用Python写爬虫抓取网页数据

    机器学习首先面临的一个问题就是准备数据,数据的来源大概有这么几种:公司积累数据,购买,交换,政府机构及企业公开的数据,通过爬虫从网上抓取.本篇介绍怎么写一个爬虫从网上抓取公开的数据. 很多语言都可以写 ...

  7. [原创]HBase学习笔记(2)- 基本操作

    1.使用hbase shell连接hbase 2.输入help可以查看帮助 3.输入list查看当前hbase中的所有表 4.使用create创建表test 其中test是表名,cf是列族.该表只创建 ...

  8. iOS:多媒体(18-01-25更)

    1.音频 2.视频 1. 2.AVPlayer 1.音频 2.视频 1. 2.AVPlayer 0).写在前面 AVPlayer 主要包含 AVPlayer.AVPlayerItem.AVPlayer ...

  9. java8 新特性 Stream流 分组 排序 过滤 多条件去重

    private static List<User> list = new ArrayList<User>(); public static void main(String[] ...

  10. (Les16 执行数据库恢复)-控制文件恢复

    测试丢失所有控制文件恢复[20180517]     rman target /   show all;   configure channel 1 device type disk format ' ...