python爬虫常用库和安装 -- windows7环境

1：urllib python自带

2：re python自带

3：requests pip install requests

4：selenium 需要依赖chromedriver

(selenium目前有版本限制：https://blog.csdn.net/qq_36625806/article/details/81463872)

下载地址：https://download.csdn.net/my

安装方式：解压后 python setup.py install -->>添加到环境变量path中

5：chromedriver 下载地址：https://download.csdn.net/download/qq_36625806/10589319

放到python安装目录中即可。

6：phantomjs 无界面浏览器，相当于一个网页控制台

下载地址：https://download.csdn.net/download/qq_36625806/10589328

将bin目录配置到环境变量的path中

7：xlml pip install lxml

或访问：https://pypi.python.org/pypi/lxml 下载

8：beautifulsoup pip install beautifulsoup4 (网页解析库，依赖xlml)

9：pyquery pip install pyquery (网页解析库，语法跟jquery完全一致)

官方api：https://pythonhosted.org/pyquery/api.html

10：pymysql pip install pymysql (操作mysql的库)

11：pymongo pip install pymongo (操作Mongodb数据库)

12：redis pip install redis (操作redis)

13：flask pip install flask (代理)

14：django pip install django (python前端框架)

官网：https://www.djangoproject.com

15：jupyter pip install jupyter (记事本，可以在线运行代码)

安装jupyter如果遇到超时的问题，用以下命令安装：

pip install jupyter --timeout 30000

jupyter安装成功后，在命令行输入：jupyter notebook启动

浏览器会自动打开jupyter

ctrl+回车运行代码

b 换新行

python爬虫常用库和安装 -- windows7环境的更多相关文章

Python爬虫学习==>第五章：爬虫常用库的安装
学习目的: 爬虫有请求库(request.selenium).解析库.存储库(MongoDB.Redis).工具库,此节学习安装常用库的安装正式步骤 Step1:urllib和re库这两个库在安装 ...
爬虫-Python爬虫常用库
一.常用库 1.requests 做请求的时候用到. requests.get("url") 2.selenium 自动化会用到. 3.lxml 4.beautifulsoup 5 ...
Python爬虫常用库安装
建议更换pip源到国内镜像,下载会快很多:https://www.cnblogs.com/believepd/p/10499844.html requests pip3 install request ...
Python 爬虫常用库（九）
python爬虫学习笔记（一）——环境配置（windows系统）
在进行python爬虫学习前,需要进行如下准备工作: python3+pip官方配置 1.Anaconda(推荐,包括python和相关库) [推荐地址:清华镜像] https://mirrors ...
windows下python常用库的安装
windows下python常用库的安装,前提安装了annaconda 的python开发环境.只要已经安装了anaconda,要安装别的库就很简单了.只要使用pip即可,正常安装好python,都会 ...
Python爬虫Urllib库的高级用法
Python爬虫Urllib库的高级用法设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Head ...
Python爬虫—requests库get和post方法使用
目录 Python爬虫-requests库get和post方法使用 1. 安装requests库 2.requests.get()方法使用 3.requests.post()方法使用-构造formda ...
python爬虫---selenium库的用法
python爬虫---selenium库的用法 selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器在爬虫中的应用主要是用来解决JS渲染的问题. 1.使用前需要安装这个 ...

随机推荐

单点登录CAS系列第06节之客户端配置单点登录
原理纯web.xml 借助Spring 注意代码测试原理这里用的是:cas-client-core-3.4.0.jar(2015-07-21发布的) 下载地址为:http://mvnrepo ...
【转】Android Monkey 命令行可用的全部选项
常规事件约束限制调试原文参见:http://www.douban.com/note/257030384/ 常规 –help 列出简单的用法. -v 命令行的每一个 -v 将增加反馈信息的级别. ...
Android APP性能及专项测试
移动测试. Android测试 .APP测试 Android篇 1. 性能测试 Android性能测试分为两类:1.一类为rom版本(系统)的性能测试2.一类为应用app的性能测试 Android的a ...
git基本命令（二）
忽略文件 git可以将用户指定的文件或者目录排除在版本之外,它会检查代码仓库目录下是否存在名为.gitignore文件,如果存在就会一行一行读取这个文件的内容,会将每一行指定的文件或目录排除 ...
联想拯救者y7000使用体验
前言我以前的电脑是在电商平台买的二手电脑,期间觉得软件的运行速度慢,又在网上买了一个128G的固态硬盘安装上.就从大一到大四上学期这么使用了三年半的时间.因为自己需要运行一些吃内存的软件,而我的这个 ...
symfony 5.05 dev安装为了更好的迭代更新
我的项目目录安装命令 composer create-project symfony/website-skeleton:^5.0.x-dev manage 数据查询测试输出
达拉草201771010105《面向对象程序设计（java）》第一周学习总结
达拉草201771010105<面向对象程序设计(java)>第一周学习总结第一部分:课程准备部分填写课程学习平台注册账号, 平台名称注册账号博客园:www.cnblogs.co ...
swoole(1)使用docker安装swoole环境
1.下载镜像 pull php 镜像 docker pull php:7.3-alpine3.8 创建容器 docker run -it --name test php:7.3-alpine3.8 s ...
jdbc Template 存储过程返回多个结果，out 输出参数
public ReportVo getReport() { //执行存储过程 ReportVo reportVo=jdbcTemplate.execute(new CallableStatementC ...
sqlserver取分组数据的最后一条数据
SQL Server中ROW_NUMBER()函数的使用参考文章:https://blog.csdn.net/pan_junbiao/article/details/79941162 业务中的问题: ...

python爬虫常用库和安装 -- windows7环境

python爬虫常用库和安装 -- windows7环境的更多相关文章

随机推荐

热门专题