「数据挖掘入门系列」Python快速入门
Python环境搭建
本次入门系列将使用Python作为开发语言。要使用Python语言,我们先来搭建Python开发平台。我们将基于Python 2.7版本、以及Python的开发发行版本Anaconda版本来开发。
Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。
下载地址:
https://www.anaconda.com/distribution/,注意要下载2.7版本

下载好Anaconda安装包后,即可安装,安装好后,我们可以来测试下Python环境是否已经搭建好。

Python语言入门
本小节将简单介绍Python语言,此处不会涉及过多的Python语言细节。例如:面向对象之类。此处主要介绍后续学习数据挖掘过程中会使用到的语法。
Hello Python
此案例将在控制台上打印 Hello, Python。
1、创建一个文本文件,并命名为hello_python.py
2、编写以下内容
# 打印字符串
print 'hello, python'
3、在命令行中执行命令 python hello_python.py
多重赋值
Python中支持多重赋值
# -*- coding: utf-8 -*
# 多重赋值
zhangsan, lisi, wangwu = u'张三', u'李四', u'王五'
print zhangsan, lisi, wangwu
注意:
- 在python中要使用中文,需要在文件头上加入 # -*- coding: utf-8 –*
- 字符串应该使用 u开头
条件判断
python条件判断可以使用 if …. elif … else,但逻辑条件使用 and、or。Python一般不使用花括号,而使用缩进对齐来作为区分。参考以下代码:
'''
案例三:
定义变量 username 和 password
1. 如果 username 为 abc,且password为 123, 打印 正确
2. 如果 username 不为 abc,打印用户名错误
3. 如果 password 不为 123,打印密码错误
'''
username = 'abc'
password = '123' if username == 'abc' and password == '123':
print u'正确'
else:
if username != 'abc':
print u'用户名错误'
else:
print u'密码错误'
for循环
# 打印 1-10之间的数字
for i in range(1, 11):
print i
函数
在Python可以使用def或者lambda表达式来定义函数:
# 定义一个函数计算两个数字的和
def add(a, b):
return a + b # 调用函数
print add(1, 1) print '==' * 10 # 使用 lambda表达式定义函数
add_lambda = lambda x,y: x + y
print add_lambda(1, 1)
集合
以下代码演示列表、元组、字典的使用
# 定义列表
list1 = [1,2,3,4,5]
# 定义元组
tuple1 = (1,2,3,4)
# 定义字典
dict1 = {'zhangsan':20, 'lisi': 30} print list1
print tuple1
print dict1
注意:元组的元素是不可以被修改的。
可以使用 []来访问集合的元素
函数式编程
Python支持函数式编程,编写起来也很方便
# 函数式编程
# 1. 初始化一个集合,包含数字从1-10
list2 = range(1, 11)
# 2. 对每一个数字 +1
list3 = map(lambda n:n+1, list2)
print list3
# 3. 过滤集合中所有能够整除2的数字
list4 = filter(lambda n: n%2==0, list2)
print list4
使用库函数
Python中需要使用到外部的函数,可以使用import关键字来导入库函数
# 导入库
import math print math.pi
print math.sin(1) # 给math库取一个别名
import math as m print m.pi
添加第三方库
要使用Python进行数据挖掘开发,需要提前安装第三方库。Python中有非常丰富的第三方库。使用以下方式可以非常简便地安装第三方库。
使用pip安装。以下将演示使用pip来安装各类数据分析工具。
Numpy
Numpy实现了真正的数组功能。很多高级的库都依赖该库。我们可以使用pip来安装它。
pip install numpy
「数据挖掘入门系列」Python快速入门的更多相关文章
- WPF快速入门系列(8)——MVVM快速入门
一.引言 在前面介绍了WPF一些核心的内容,其中包括WPF布局.依赖属性.路由事件.绑定.命令.资源样式和模板.然而,在WPF还衍生出了一种很好的编程框架,即WVVM,在Web端开发有MVC,在WPF ...
- 给深度学习入门者的Python快速教程
给深度学习入门者的Python快速教程 基础篇 numpy和Matplotlib篇 本篇部分代码的下载地址: https://github.com/frombeijingwithlove/dlcv_f ...
- 深度学习入门者的Python快速教程 - 基础篇
5.1 Python简介 本章将介绍Python的最基本语法,以及一些和深度学习还有计算机视觉最相关的基本使用. 5.1.1 Python简史 Python是一门解释型的高级编程语言,特点是简单明 ...
- 给深度学习入门者的Python快速教程 - 番外篇之Python-OpenCV
这次博客园的排版彻底残了..高清版请移步: https://zhuanlan.zhihu.com/p/24425116 本篇是前面两篇教程: 给深度学习入门者的Python快速教程 - 基础篇 给深度 ...
- 给深度学习入门者的Python快速教程 - numpy和Matplotlib篇
始终无法有效把word排版好的粘贴过来,排版更佳版本请见知乎文章: https://zhuanlan.zhihu.com/p/24309547 实在搞不定博客园的排版,排版更佳的版本在: 给深度学习入 ...
- Python快速入门
Python快速入门 一.基础概要 命名:h.py Linux命令行运行:python h.py 注释.数字.字符串: 基本类型只有数字与字符串 #python注释是这样写的 ''' 当然也可以这样 ...
- python快速入门及进阶
python快速入门及进阶 by 小强
- Python快速入门PDF高清完整版免费下载|百度云盘
百度云盘:Python快速入门PDF高清完整版免费下载 提取码:w5y8 内容简介 这是一本Python快速入门书,基于Python 3.6编写.本书分为4部分,第一部分讲解Python的基础知识,对 ...
- ElasticSearch实战系列八: Filebeat快速入门和使用---图文详解
前言 本文主要介绍的是ELK日志系统中的Filebeat快速入门教程. ELK介绍 ELK是三个开源软件的缩写,分别表示:Elasticsearch , Logstash, Kibana , 它们都是 ...
随机推荐
- 机器学习-K最近邻算法
一.介绍 二.编程 练习一(K最近邻算法在单分类任务的应用): import numpy as np #导入科学计算包import matplotlib.pyplot as plt #导入画图工具fr ...
- 机器学习环境配置系列五之keras2
keras一个大坑就是配置文件的问题,网上会给很多的误导,让我走了很多弯路. 1.安装keras2 conda install keras 2.环境配置 echo ‘{ "epsilon&q ...
- Ganglia安装及配置
Ganglia安装及配置root用户下yum安装所依赖的环境(实际生产环境都已安装)yum -y install apr-develapr-util check-devel cairo-devel p ...
- HDU-2841 Visible Trees(莫比乌斯反演)
Visible Trees 传送门 解题思路: 实际上的答案就是1~n与1~m之间互质的数的对数,写出式子就是 \(ans=\sum^{n}_{i=1}\sum^{m}_{j=1}[gcd(i,j)= ...
- 2016 CCPC-Final-Wash(优先队列+贪心)
Wash Mr.Panda is about to engage in his favourite activity doing laundry! He’s brought ...
- Spring注解开发系列Ⅴ --- 自动装配&Profile
自动装配: spring利用依赖注入和DI完成对IOC容器中各个组件的依赖关系赋值.自动装配的优点有: 自动装配可以大大地减少属性和构造器参数的指派. 自动装配也可以在解析对象时更新配置. 自动装配的 ...
- shiro盐值加密并验证
在数据表中存的密码不应该是123456,而应该是123456加密之后的字符串,而且还要求这个加密算法是不可逆的,即由加密后的字符串不能反推回来原来的密码,如果能反推回来那这个加密是没有意义的.著名的加 ...
- 手把手写框架入门(一) | 核心拦截器DispatchFilter实现
前言 1Filter实现框架拦截 1配置自定义Filter 2创建一个Filter 3创建一个ActionMapping 4创建一个ActionMapper 5创建一个WebExecutor 6创建测 ...
- HDU 5558 Alice's Classified Message(后缀数组+二分+rmq(+线段树?))
题意 大概就是给你一个串,对于每个\(i\),在\([1,i-1]\)中找到一个\(j\),使得\(lcp(i,j)\)最长,若有多个最大\(j\)选最小,求\(j\)和这个\(lcp\)长度 思路 ...
- React+Echarts简单的封装套路
今天我们来介绍一下React中,对Echarts的一个简单的封装. 首先在我们的React项目中,想使用Echart包,首先需要先安装它,安装代码如下,任选一个就可以 cnpm install ech ...