「数据挖掘入门系列」Python快速入门
Python环境搭建
本次入门系列将使用Python作为开发语言。要使用Python语言,我们先来搭建Python开发平台。我们将基于Python 2.7版本、以及Python的开发发行版本Anaconda版本来开发。
Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。
下载地址:
https://www.anaconda.com/distribution/,注意要下载2.7版本

下载好Anaconda安装包后,即可安装,安装好后,我们可以来测试下Python环境是否已经搭建好。

Python语言入门
本小节将简单介绍Python语言,此处不会涉及过多的Python语言细节。例如:面向对象之类。此处主要介绍后续学习数据挖掘过程中会使用到的语法。
Hello Python
此案例将在控制台上打印 Hello, Python。
1、创建一个文本文件,并命名为hello_python.py
2、编写以下内容
# 打印字符串
print 'hello, python'
3、在命令行中执行命令 python hello_python.py
多重赋值
Python中支持多重赋值
# -*- coding: utf-8 -*
# 多重赋值
zhangsan, lisi, wangwu = u'张三', u'李四', u'王五'
print zhangsan, lisi, wangwu
注意:
- 在python中要使用中文,需要在文件头上加入 # -*- coding: utf-8 –*
- 字符串应该使用 u开头
条件判断
python条件判断可以使用 if …. elif … else,但逻辑条件使用 and、or。Python一般不使用花括号,而使用缩进对齐来作为区分。参考以下代码:
'''
案例三:
定义变量 username 和 password
1. 如果 username 为 abc,且password为 123, 打印 正确
2. 如果 username 不为 abc,打印用户名错误
3. 如果 password 不为 123,打印密码错误
'''
username = 'abc'
password = '123' if username == 'abc' and password == '123':
print u'正确'
else:
if username != 'abc':
print u'用户名错误'
else:
print u'密码错误'
for循环
# 打印 1-10之间的数字
for i in range(1, 11):
print i
函数
在Python可以使用def或者lambda表达式来定义函数:
# 定义一个函数计算两个数字的和
def add(a, b):
return a + b # 调用函数
print add(1, 1) print '==' * 10 # 使用 lambda表达式定义函数
add_lambda = lambda x,y: x + y
print add_lambda(1, 1)
集合
以下代码演示列表、元组、字典的使用
# 定义列表
list1 = [1,2,3,4,5]
# 定义元组
tuple1 = (1,2,3,4)
# 定义字典
dict1 = {'zhangsan':20, 'lisi': 30} print list1
print tuple1
print dict1
注意:元组的元素是不可以被修改的。
可以使用 []来访问集合的元素
函数式编程
Python支持函数式编程,编写起来也很方便
# 函数式编程
# 1. 初始化一个集合,包含数字从1-10
list2 = range(1, 11)
# 2. 对每一个数字 +1
list3 = map(lambda n:n+1, list2)
print list3
# 3. 过滤集合中所有能够整除2的数字
list4 = filter(lambda n: n%2==0, list2)
print list4
使用库函数
Python中需要使用到外部的函数,可以使用import关键字来导入库函数
# 导入库
import math print math.pi
print math.sin(1) # 给math库取一个别名
import math as m print m.pi
添加第三方库
要使用Python进行数据挖掘开发,需要提前安装第三方库。Python中有非常丰富的第三方库。使用以下方式可以非常简便地安装第三方库。
使用pip安装。以下将演示使用pip来安装各类数据分析工具。
Numpy
Numpy实现了真正的数组功能。很多高级的库都依赖该库。我们可以使用pip来安装它。
pip install numpy
「数据挖掘入门系列」Python快速入门的更多相关文章
- WPF快速入门系列(8)——MVVM快速入门
一.引言 在前面介绍了WPF一些核心的内容,其中包括WPF布局.依赖属性.路由事件.绑定.命令.资源样式和模板.然而,在WPF还衍生出了一种很好的编程框架,即WVVM,在Web端开发有MVC,在WPF ...
- 给深度学习入门者的Python快速教程
给深度学习入门者的Python快速教程 基础篇 numpy和Matplotlib篇 本篇部分代码的下载地址: https://github.com/frombeijingwithlove/dlcv_f ...
- 深度学习入门者的Python快速教程 - 基础篇
5.1 Python简介 本章将介绍Python的最基本语法,以及一些和深度学习还有计算机视觉最相关的基本使用. 5.1.1 Python简史 Python是一门解释型的高级编程语言,特点是简单明 ...
- 给深度学习入门者的Python快速教程 - 番外篇之Python-OpenCV
这次博客园的排版彻底残了..高清版请移步: https://zhuanlan.zhihu.com/p/24425116 本篇是前面两篇教程: 给深度学习入门者的Python快速教程 - 基础篇 给深度 ...
- 给深度学习入门者的Python快速教程 - numpy和Matplotlib篇
始终无法有效把word排版好的粘贴过来,排版更佳版本请见知乎文章: https://zhuanlan.zhihu.com/p/24309547 实在搞不定博客园的排版,排版更佳的版本在: 给深度学习入 ...
- Python快速入门
Python快速入门 一.基础概要 命名:h.py Linux命令行运行:python h.py 注释.数字.字符串: 基本类型只有数字与字符串 #python注释是这样写的 ''' 当然也可以这样 ...
- python快速入门及进阶
python快速入门及进阶 by 小强
- Python快速入门PDF高清完整版免费下载|百度云盘
百度云盘:Python快速入门PDF高清完整版免费下载 提取码:w5y8 内容简介 这是一本Python快速入门书,基于Python 3.6编写.本书分为4部分,第一部分讲解Python的基础知识,对 ...
- ElasticSearch实战系列八: Filebeat快速入门和使用---图文详解
前言 本文主要介绍的是ELK日志系统中的Filebeat快速入门教程. ELK介绍 ELK是三个开源软件的缩写,分别表示:Elasticsearch , Logstash, Kibana , 它们都是 ...
随机推荐
- 【java面试】数据库篇
1.SQL语句分为哪几种? SQL语句主要可以划分为以下几类: DDL(Data Definition Language):数据定义语言,定义对数据库对象(库.表.列.索引)的操作. 包括:CREAT ...
- HTML5 App商业开发实战教程 基于WeX5可视化开发平台
- Java容器解析系列(13) WeakHashMap详解
关于WeakHashMap其实没有太多可说的,其与HashMap大致相同,区别就在于: 对每个key的引用方式为弱引用; 关于java4种引用方式,参考java Reference 网上很多说 弱引用 ...
- 移动端ui框架
https://blog.csdn.net/Robin_star_/article/details/81810197
- java泛型梳理
java泛型梳理 概述 泛型,即参数化类型,是在JDK1.5之后才开始引入的. 所谓参数化类型是指所操作的数据类型在定义时被定义为一个参数,然后在使用时传入具体的类型. 这种参数类型可以用在类,接口, ...
- Web自动化测试项目搭建目录
Web自动化测试项目搭建(一) 需求与设计 Web自动化测试项目(二)BasePage实现 Web自动化测试项目(三)用例的组织与运行 Web自动化测试项目(四)测试报告 Web自动化测试项目(五)测 ...
- Nodejs实战系列:数据加密与crypto模块
博客地址:<NodeJS模块研究 - crypto> Github :https://github.com/dongyuanxin/blog nodejs 中的 crypto 模块提供了各 ...
- <背包>solution-POJ1742_Coins
POJ1742 - Coins People in Silverland use coins.They have coins of value A1,A2,A3...An Silverland dol ...
- SASS用法入门
本文参考了 阮一峰 老师对 SASS 用法的讲解. 学过 CSS 的人都知道,它不是一种编程语言,在日常的开发中,经常要写大量的 css 代码,有很多的重复代码,效率很低.Sass 是一个 CSS 的 ...
- scrapy-redis分布式爬虫实战
Scrapy-Redis代码实战 Scrapy 是一个通用的爬虫框架,但是不支持分布式,Scrapy-redis是为了更方便地实现Scrapy分布式爬取,而提供了一些以redis为基础的组件(仅有组件 ...