python爬虫常用库和安装 -- windows7环境

1：urllib python自带

2：re python自带

3：requests pip install requests

4：selenium 需要依赖chromedriver

(selenium目前有版本限制：https://blog.csdn.net/qq_36625806/article/details/81463872)

下载地址：https://download.csdn.net/my

安装方式：解压后 python setup.py install -->>添加到环境变量path中

5：chromedriver 下载地址：https://download.csdn.net/download/qq_36625806/10589319

放到python安装目录中即可。

6：phantomjs 无界面浏览器，相当于一个网页控制台

下载地址：https://download.csdn.net/download/qq_36625806/10589328

将bin目录配置到环境变量的path中

7：xlml pip install lxml

或访问：https://pypi.python.org/pypi/lxml 下载

8：beautifulsoup pip install beautifulsoup4 (网页解析库，依赖xlml)

9：pyquery pip install pyquery (网页解析库，语法跟jquery完全一致)

官方api：https://pythonhosted.org/pyquery/api.html

10：pymysql pip install pymysql (操作mysql的库)

11：pymongo pip install pymongo (操作Mongodb数据库)

12：redis pip install redis (操作redis)

13：flask pip install flask (代理)

14：django pip install django (python前端框架)

官网：https://www.djangoproject.com

15：jupyter pip install jupyter (记事本，可以在线运行代码)

安装jupyter如果遇到超时的问题，用以下命令安装：

pip install jupyter --timeout 30000

jupyter安装成功后，在命令行输入：jupyter notebook启动

浏览器会自动打开jupyter

ctrl+回车运行代码

b 换新行

python爬虫常用库和安装 -- windows7环境的更多相关文章

Python爬虫学习==>第五章：爬虫常用库的安装
学习目的: 爬虫有请求库(request.selenium).解析库.存储库(MongoDB.Redis).工具库,此节学习安装常用库的安装正式步骤 Step1:urllib和re库这两个库在安装 ...
爬虫-Python爬虫常用库
一.常用库 1.requests 做请求的时候用到. requests.get("url") 2.selenium 自动化会用到. 3.lxml 4.beautifulsoup 5 ...
Python爬虫常用库安装
建议更换pip源到国内镜像,下载会快很多:https://www.cnblogs.com/believepd/p/10499844.html requests pip3 install request ...
Python 爬虫常用库（九）
python爬虫学习笔记（一）——环境配置（windows系统）
在进行python爬虫学习前,需要进行如下准备工作: python3+pip官方配置 1.Anaconda(推荐,包括python和相关库) [推荐地址:清华镜像] https://mirrors ...
windows下python常用库的安装
windows下python常用库的安装,前提安装了annaconda 的python开发环境.只要已经安装了anaconda,要安装别的库就很简单了.只要使用pip即可,正常安装好python,都会 ...
Python爬虫Urllib库的高级用法
Python爬虫Urllib库的高级用法设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Head ...
Python爬虫—requests库get和post方法使用
目录 Python爬虫-requests库get和post方法使用 1. 安装requests库 2.requests.get()方法使用 3.requests.post()方法使用-构造formda ...
python爬虫---selenium库的用法
python爬虫---selenium库的用法 selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器在爬虫中的应用主要是用来解决JS渲染的问题. 1.使用前需要安装这个 ...

随机推荐

canvas基本
基本支持ie 9+,firefox,opera,chrome,safari html: <canvas id="fir_canvas" width="400&qu ...
react-native start 启动错误解决方法
ERROR Error watching file for changes: EMFILE {"code":"EMFILE","errno" ...
python自动化测试技术-Allure
文末有源码大部分人可能做的是爬虫和web,数据分析方面的工作,今天分享个在自动化测试领域python能做什么样的事情,比如下方,是用python+pytest+allure生成的精美自动化测试报告, ...
[大餐]开发摘记1--我的Fragment通信的框架
[大餐]开发摘记1--我的Fragment通信的框架 | 卖牙膏的芖口钉盒子盒子博客分类标签友链大专栏 [大餐]开发摘记1--我的Fragment通信的框架ass="ROUN ...
mingster.com
Good to Great: Why Some Companies Make the Leap... and Others Don'tby Jim Collinshttp://rcm.amazon.c ...
会编程的 AI + 会修 Bug 的 AI，等于什么？
2017-02-25 Python开发者 (点击上方公众号,可快速关注) 关于人工智能未来的畅想,除了家庭服务机器人,快递无人机,医用机器人等等,Lucas Carlson 认为人工智能在另外一个领域 ...
【pic+js+gh】免费高速图床方案
本文用到的工具或网站 PicGo jsdelivr github 速度对比 Github的速度: jsdelivrCDN的速度: 下载PicGo 首先进入PicGo的下载地址选择最新版本下载,根据自 ...
Reids(4)——神奇的HyperLoglog解决统计问题
一.HyperLogLog 简介 HyperLogLog 是最早由 Flajolet 及其同事在 2007 年提出的一种估算基数的近似最优算法.但跟原版论文不同的是,好像很多书包括 Redis 作者 ...
cmake引用包初探
应要求使用的是 mediastreamer2 库.以前开发是在tools下注册了一个新的tool,现在应该另行建立一个项目. 好像 CMake 写的项目叫package??? 项目名字是 mstest ...
一文看懂js中的clientX，clientY，pageX，pageY，screenX，screenY
一. 客户区坐标位置(clientX,clientY) 鼠标事件都是在浏览器视口中的特定位置发生的.这个位置信息保存在事件对象的clientX和clientY属性中,所有浏览器都支持这两个属性. 我们 ...

python爬虫常用库和安装 -- windows7环境

python爬虫常用库和安装 -- windows7环境的更多相关文章

随机推荐

热门专题