一、Python 概述

1.计算机语言概述

(1).语言:交流的工具,沟通的媒介

(2).计算机语言:人跟计算机交流的工具

(3).Python是计算机语言的一种

2.Python编程语言

  代码:人类的语言,同代码命令机器,跟机器交(2).python解释器:担任翻译工作(3)流程:

  写代码 --> 执行:由翻译官(Python解释器)把命令(Code)翻译给机器,同时把机器结果翻译给我们

3.Python简史
  (1).1989
  (2).2008:Python 3.0 诞生
  (3)2014:宣布2.7支持到2020年
  (4)2017:AI元年,Python崛起
4.Python特点
  速度问题:相对较慢(原因参考博文为什么python运行的慢)

5.Python应用领域
  全能:WEB开发,桌面软件,网络编程,爬虫开发,云计算开发,人工智能,自动化运维,金融分析,科学运算,游戏开发

  Python的就业方向:Linux运维, Python Web网站工程师, Python自动化测试, 数据分析,人工智能

  设计哲学:平衡发展,样样通,简洁明了

6.开发环境问题
  pycharm + Python3.7
  注意:接下来所有示例代码都是基于Mac环境下Python3.7版本下的开发

7.Python的执行方式
  本质上Python是一堆命令的集合
  执行过程是逐行执行,遇到问题即可终止
  打印Hello World!

print('Hello world!')

 温馨提示:Python基础请查看廖雪峰大神官方文档,不再累述,下篇直接开始各个库的使用

二、爬虫入门

1.爬虫入门:使用代码模拟真实用户发送网络请求批量获取数据
1).爬虫价值:
1.买卖数据(高端领域特别贵)
2.数据分析(出分析报告)
3.流量
4.阿里指数,百度指数
2).合法性:灰色产业
政府没有法律规定爬虫是否违法
公司概念:公司让你爬取数据
爬虫是否可以爬所有的东西?不可以,爬虫只能爬取到用户可以访问的数据
爱奇艺视频(vip 用户,非 vip 用户)
付费小说(付费才能爬取) 2.爬虫分类:
1.通用爬虫:使用搜索引擎:百度,360,谷歌...
劣势:目标不明确,返回的内容90%是用户不需要的,不清楚用户的需求在哪里
优势:开放性,速度快
2.聚焦爬虫:
优势:目标明确,对用户的需求非常精准,返回的内容固定
3.增量式爬虫:翻页,从第一页爬到最后一页
4.Deep,深度爬虫:静态数据 html,动态数据:js 代码,加密的 js
robost协议:是否允许其他爬虫(通用爬虫)爬取某些内容 3.爬虫的工作原理:
1.查询你抓取目标的 url(必须的,难)
2.使用 Python 代码发送请求获取数据
3.解析获取道德数据(精准数据)
4.数据持久化

Python爬虫从入门到进阶(1)之Python概述及爬虫入门的更多相关文章

  1. Django入门到进阶-更适合Python小白的系统课程

    Django入门到进阶-更适合Python小白的系统课程 整个课程都看完了,这个课程的分享可以往下看,下面有链接,之前做java开发也做了一些年头,也分享下自己看这个视频的感受,单论单个知识点课程本身 ...

  2. Python 爬虫从入门到进阶之路(十四)

    之前的文章我们已经可以根据 re 模块,Xpath 模块和 BeautifulSoup4 模块来爬取网站上我们想要的数据并且存储在本地,但是我们并没有对存储数据的格式有要求,本章我们就来看数据的存储格 ...

  3. Python爬虫与数据分析之进阶教程:文件操作、lambda表达式、递归、yield生成器

    专栏目录: Python爬虫与数据分析之python教学视频.python源码分享,python Python爬虫与数据分析之基础教程:Python的语法.字典.元组.列表 Python爬虫与数据分析 ...

  4. Python第三方库matplotlib(2D绘图库)入门与进阶

    Matplotlib 一 简介: 二 相关文档: 三 入门与进阶案例 1- 简单图形绘制 2- figure的简单使用 3- 设置坐标轴 4- 设置legend图例 5- 添加注解和绘制点以及在图形上 ...

  5. Python入门到进阶必看的权威书籍与网站

    随着人工智能全面爆发,Python[英文单词:蟒蛇],是一款近年来爆红的计算机编程语言.1989年发明,1991年发行,比目前应用最广的Java还要大7岁,有种大器晚成的感觉. 分享之前我还是要推荐下 ...

  6. 学习Python的书籍——入门到进阶

    入门读物 <Python基础教程>(Beginning Python From Novice to Professional) <Python学习手册>(Learning Py ...

  7. Python带我起飞——入门、进阶、商业实战_ 入门版电子书籍分享,

    Python带我起飞--入门.进阶.商业实战_ 免费下载地址 内容简介 · · · · · · <Python带我起飞--入门.进阶.商业实战>针对Python 3.5 以上版本,采用&q ...

  8. Python语言学习之Python入门到进阶

    人们常说Python语言简单,编写简单程序时好像也确实如此.但实际上Python绝不简单,它也是一种很复杂的语言,其功能特征非常丰富,能支持多种编程风格,在几乎所有方面都能深度定制.要想用好Pytho ...

  9. Python第三方库wordcloud(词云)快速入门与进阶

    前言: 笔主开发环境:Python3+Windows 推荐初学者使用Anaconda来搭建Python环境,这样很方便而且能提高学习速度与效率. 简介: wordcloud是Python中的一个小巧的 ...

随机推荐

  1. Oracle 执行计划(一)-------基本介绍

    本文参照自:https://www.cnblogs.com/Dreamer-1/p/6076440.html 打开SQL执行计划: 1.选中一句正在执行的SQL 2.F5快捷键,就会出现下图,这就是执 ...

  2. Lightoj 1128 - Greatest Parent

    Gate 倍增模板,在一个严格小根堆中,给定$x,y$,求$x$的祖先中$≥y$的最高点. 注意清零 #include<cstdio> #include<iostream> # ...

  3. Linux内存管理 (23)一个内存Oops解析

    专题:Linux内存管理专题 关键词:DataAbort.fsr.pte.backtrace.stack.   在内存相关实际应用中,内存异常访问是一种常见的问题. 本文结合异常T32栈回溯.Oops ...

  4. 自己编写 EntityTypeConfiguration

    1.新建类库 EFCore.EntityTypeConfig ,安装nuget  PM> Install-Package Microsoft.EntityFrameworkCore 2.新建接口 ...

  5. 基于 HTML5 的 WebGL 楼宇自控 3D 可视化监控

    前言 智慧楼宇和人们的生活息息相关,楼宇智能化程度的提高,会极大程度的改善人们的生活品质,在当前工业互联网大背景下受到很大关注.目前智慧楼宇可视化监控的主要优点包括: 智慧化 -- 智慧楼宇是一个生态 ...

  6. python scapy dns 包字段解析

    qr:   0表示查询报文,1表示响应报文opcode: 通常值为0(标准查询),其他值为1(反向查询)和2(服务器状态请求).aa: 表示授权回答(authoritative answer)tc: ...

  7. AI要被祭天了!删Bug,删着删着把全部代码都删了

    近日,美国版的“大众点评”,本想训练 AI 来消除 bug,结果它把所有内容删除了... Yelp 在其最新更新的 App 中写道: “我们为本周使用该app遇到问题的用户致歉.我们训练了一个神经网络 ...

  8. 细述:nginx http内核模块提供的变量和解释

    导读 ngx_http_core_module模块在处理请求时,会有大量的变量,这些变量可以通过访问日志来记录下来,也可以用于其它nginx模块. 在我们对请求做策略如改写等等都会使用到一些变量,顺便 ...

  9. Null value was assigned to a property of primitive type setter of com.oa.manager.personnel.bean.KqAttendanceHoliday.dayType

    问题: 解决方法:依据提示,把 int 修改为Integer解决. 总结: javaBean最好不要使用基本类型(记得某规范说过,具体不记得了,估计就是预防这样的问题吧)

  10. Teching Yourself Programming in Ten Years -Peter Norvig

    http://norvig.com/21-days.html 我们经常能看到“7天搞定51单片机”.“21天学会C++”这样样式的标题,编程真的很容易吗?似乎比其他事情要简单很多呀!是的,糟糕的编程确 ...