每天学一点Python（2）

9月16日（python扩展的安装和使用）

接着上一篇继续。按照之前计划，先分析导出的数据，再做进一步统计。

导出的数据是html类型的，想到的处理方法有：

1.直接readlines然后一行一行找我想要的数据

2.用自带的HTMLParser分析HTML

3.用Beautifulsoup分析HTML

4.用pyquery分析HTML

5.把HTML的转成Excel，然后用xlrd分析Excel

前两种方法目前感觉有点麻烦，比较倾向于第二三种。因为后面三种办法都需要安装扩展包，所以先学习安装扩展包。

一般方法是先解压扩展包，然后用cmd到扩展包的目录下，执行python setup.py install（直接在cmd执行python需要你在环境变量path里加上python的目录）。

先进一点的方法是用easy_install，去网上搜可能找到的是ez_setup.py，在cmd里python ez_setup.py就安装好了。也可能在网上找到的安装包叫做setuptools，没有问题，其实easy_install只是setuptools的一个命令，这两种安装的结果是一样的。

把easy_install的目录也放到Path里后就可以直接用“ easy_install 扩展包”来自动下载和更新想要的扩展包了，网上的说法是他可以自己解决扩展包之间的依赖问题。但我在安装pyquery时，反复报错，仔细看了看是缺少lxml包。到这里然后搜lxml，下载安装后，即可安装pyquery。

扩展包可以通过import与from...import来使用，第一种方法是导入所有，使用时需要sys.argv这样写完整，第二种是导入一部分，假如只导入了argv，则程序里直接省去“sys.”，如果写成“from sys import *”，可以省略“sys.”并且导入所有，但不加前面那部分太容易混淆了。

9月17日（Beautifulsoup分析HTML，SQLite入门）

1.使用Beautifusoup

仔细看了看Beautifusoup和pyquery，更喜欢Beautifulsoup的风格，最后决定用他了！

直接上代码

from bs4 import BeautifulSoup

def GetStuList(url):

        doc=open(url)

        soup=BeautifulSoup(doc)

        StuList=[]

        for i in soup.findAll('tr'):
                j=i.findAll('td')

                tuple1=(j[2].contents[0],

                        j[3].contents[0],

                        j[4].contents[0],

                        j[5].contents[0],

                        j[6].contents[0],

                        j[7].contents[0],

                        j[8].contents[0],

                        j[9].contents[0],

                        j[11].contents[0])

                StuList.append(tupple1)

        return StuList

首先导入BeautifulSoup,这里一定要注意啊，按网上的写法都是from BeautifulSoup import BeautifulSoup 新版本改成bs4，写法要变成上面的，我弄了半天才发现。

然后定义方法，打开HTML文件，然后用BeautifulSoup解析。介绍两个主要方法findAll和find，一个是查找所有，一个是只查找第一个，这两个方法的前两个参数都是（name=None, attrs={}），节点名字和属性集合。然后遍历把需要的值都放在一个List里。

为了方便以后用，把段代码保存到Python根目录下getlist.py，下次直接用 import getlist就可以了。注意，一定别写成 import getlist.py。

2.SQLite入门。

我用的是windows X86版本，这里是下载地址。

直接解压就可以了，为了在cmd方便使用，放在一个简单的目录下（也可以设置Path环境变量）。SQLite真是太简洁了，非常喜欢。用两条命令来开始。

sqlite3 woody.db //在sqlite所在目录下新建一个woody数据库，如果存在就打开。

sqlite> create table mytable(id integer primary key AUTOINCREMENT, name text); //新建一个表，有两列

剩下的其实就是SQL语句操作，大多数都支持。

创建表的时候假如没有令主键自动增长，插入的时候不插入主键也会自动增长，因为Sqlite中假如插入一条数据的时候主键为空，他就在现有表里找最大的主键值，然后+1。但这有可能导致删除了的主键接上继续。。所以，还是写上AUTOINCREMENT好一些。

然后用python连接数据库

 import sqlite3

 con=sqlite3.connect("C:/sqlite/woody.db")# 连接数据库

 sql=con.cousor()#创建游标

 sql.execute("SELECT * FROM myTable")#执行SQL语句

 sql.fetchon()#取出一条，fetchmany()是取出多条

记得连接的时候一定要写全部路径，不然会在python根目录下直接创建一个新的数据库。==#

数据库连接con有下面几个方法。

commit()#事务提交

rollback()#事务回滚

close()#关闭一个数据库连接

cursor()#创建一个游标

游标sql有下面几个方法。

execute()#执行sql语句

executemany#执行多条sql语句

close()#关闭游标

fetchone()#从结果中取一条记录，并将游标指向下一条记录

fetchmany()#从结果中取多条记录

fetchall()#从结果中取出所有记录

scroll()#游标滚动

参数化插入操作

for t in[(0,'woody','hahah'),(1,'hahah','hah')]:

    sql.execute("insert into catalog values (?,?,?)", t)

sql.commit()

9月21日

转眼都22号了，大家中秋快乐啊，三天假期经历和思考了很多，晚上仔细再写一篇。被项目拖的有些疲惫了，快一周没更新学习进度。

囧。。被项目拖着，python学习先停几天吧。

每天学一点Python（2）的更多相关文章

每天学一点Python
9月11日 1.用List实现Python里的?:条件表达式 ["false","true"][判断条件] 其实就是一个List[0]还是List[1]的问题. ...
最近都会来学一点Python
https://www.cnblogs.com/hellosecretgarden/p/9206648.html 打开电脑,发现Python都是之前的代码,将近一年之前的时间. 最近都会重新掌握起来, ...
每天学一点——python基本数据类型
python基本数据类型字符串类型(str) 字符串类型的数据一定是描述性质的,且由引号括起来的数据都是字符串数据(单引号.双引号.三引号.) 如下图 (简单易懂) 这里列举一些不明所以的问题如图 ...
每天学一点——python变量、常量与数字类型
python变量.常量与数字类型常量 (一句话能概括先讲它) 严格来讲,python中除了π与N就没有不变的量所以,在python中我们识别常量是看它是否全大写(如下图) 变量变量,顾名思义,就 ...
每天学一点——python注释规范
python注释规范 python注释语法这个是注释注释是不影响代码运行的当然注释也是有书写规范的,就像图片中的注释前面#加空格再加上这条代码的注释(单行注释用#) 不然你会得到下面的结果 * ...
每天学一点——python用户的交互、格式化输出与基础运算符运用
用户交互 input输入 input接收的数据都是字符串类型如下图 output输出还可以相加换行符想让他们隔行排列的话就可以这样(如图) 在想各行的开头前面加上\n即可那若是想将两个输出的 ...
人工智能时代，是时候学点Python了！
“是时候学点Python了”.作为一名不怎么安分的程序员,你或许觉得,产生这样的想法并不奇怪,但学习Python却是出于自己对工作现状以及如何应对未来挑战所作出的思考.读过我以前博客的朋友,可能都知道 ...
学了 Python 能用来做这些！
来源商业新知网,原标题:学了 Python 能用来做什么? 说起编程语言,Python 也许不是使用最广的,但一定是现在被谈论最多的.随着近年大数据.人工智能的兴起,Python 越来越多的出现在人们 ...
编程当道，学点Python技术好傍身
为了填满AI时代的人才缺口,编程语言教育都从娃娃抓起了!如果你还不懂Python是什么将来怎么给孩子辅导作业呢? Python新手入门教程近期,浙江省信息技术课程改革方案出台,Python言语现已断 ...

随机推荐

fastjosn在低版本丢字段问题
简单的说: 对于java bean中有字段类似pId这种写法,特征是第一个字母小写,第二个字母大写,在eclipse中生成的getter setter方法是 getpId, setpId. 在低版本的 ...
IOS架构
iPhone OS(现在叫iOS)是iPhone, iPod touch 和 iPad 设备的操作系统. 1,Core OS: 是用FreeBSD和Mach所改写的Darwin, 是开源.符合POSI ...
python 类中__init__,__new__,__class__的使用详解
1.python中所有类默认继承object类,而object类提供了很多原始的内置属性和方法,所有用户定义的类在python 中也会继承这些内置属性.我们可以通过dir()进行查看.虽然python ...
精通CSS高级Web标准解决方案（7、布局）
7.1 让设计居中 7.1.1 使用自动空白边让设计居中 <body> <div id="wrapper"> </div> </body& ...
Android之操作相册
获取手机中的图片的绝对路径并且区分出每个文件夹下的路径: 存放图片绝对路径的文件夹的名字和存放绝对路径的List 实体类如下: import java.util.ArrayList; import j ...
java BigDecimal工具类
package com.core.calculate; import java.math.BigDecimal; import java.text.DecimalFormat; /** * Creat ...
Java实现简单的socket通信
今天学习了一下java如何实现socket通信,感觉难点反而是在io上,因为java对socket封装已经很完善了. 今天代码花了整个晚上调试,主要原因是io的flush问题和命令行下如何运行具有pa ...
EPEL 安装源
EPEL 安装源 EPEL 是 Extra Packages for Enterprise Linux 的缩写(EPEL),是用于 Fedora-based Red Hat Enterprise Li ...
windows系统部署springboot项目及绑定域名
http://note.youdao.com/noteshare?id=c3ccea255affd2c5d79231d67fa29103&sub=187AEEEA5CF34531A2C2315 ...
Vue中slot内容分发
<slot>元素是一个内容分发API,使用多个内容插槽时可指定name属性 <!DOCTYPE html> <html> <head> <meta ...

每天学一点Python（2）

每天学一点Python（2）的更多相关文章

随机推荐

热门专题