第一章 在python中使用数字 1.用变量存储信息 1.1变量的类型 变量,用于存储很多不同的数据类型的信息. 基本数据类型 数据类型 存储内容 示例 integer 整   float 浮点   long 非常大的数   string 字母数字空格和符号   list[列表(有时候叫数组)] 方括号括住一组项,并且项与项之间用逗号分割.   tuple[元祖] 圆括号括住的一组项,这些项不能改变.   dictionary[字典] 配对的键值对,用花括号.   1.2变量中存储数字 type…
方法是只能被该类调用的函数 print函数通常以换行作为输出结尾 字典的items方法 返回的是元组列表 即列表中的每个元素都是元组 切片左闭右开 即开始位置包含在切片中 结束位置不在 每一个对象都能通过self.__class__属性指向自己的类 类变量和对象变量 类方法和对象方法 涉及到对象才加self Pickle 将简单的python对象存储在文件中 然后可再次取回 try.finally 无论try语句是否抛出异常 finally语句都会被执行 with 有些工作事前需要设置 事后需要…
print总是以(\n)作为结尾,不换行可以指定一个空 end='' 字符串前面+r, 原始字符串 \ 显示行连接 input()函数以字符串的形式 返回键入的内容 函数参数, 有默认值的形参要放在形参列表后面 如果函数没有return语句,系统会自动在函数结尾加return None语句 DocStrings的书写惯例是:首行首字母大写,结尾有句号:第二行为空行:第三行以后为详细的描述 sys.argv是一个字符串列表 使用命令行传递参数 第一个元素总是当前的模块名 字节码.pyc文件使得导入…
给大家整理的这套python学习路线图,按照此教程一步步的学习来,肯定会对python有更深刻的认识.或许可以喜欢上python这个易学,精简,开源的语言.此套教程,不但有视频教程,还有源码分享,让大家能真正打开python的大门,进入这个领域.现在互联网巨头,都已经转投到人工智能领域,而人工智能最好的编程语言就是python,未来前景显而易见.黑马程序员是国内最早开设人工智能的机构. 一.首先先推荐一个教程 8天深入理解python教程:http://pan.baidu.com/s/1kVNm…
验证码探究 如果你是一个数据挖掘爱好者,那么验证码是你避免不过去的一个天坑,和各种验证码斗争,必然是你成长的一条道路,接下来的几篇文章,我会尽量的找到各种验证码,并且去尝试解决掉它,中间有些技术甚至我都没有见过,来吧,一起Coding吧 数字+字母的验证码 我随便在百度图片搜索了一个验证码,如下 今天要做的是验证码识别中最简单的一种办法,采用pytesseract解决,它属于Python当中比较简单的OCR识别库 库的安装 使用pytesseract之前,你需要通过pip 安装一下对应的模块 ,…
前文提及过变量代表内存里的某个数据,这个说法有根据么? 这里我们介绍一个python内建(built-in)函数id.我们先看看id函数的帮助文档吧.在python查某个函数的帮助文档很简单,只用help(xxx)即可. >>> help(id) 我们使用help查询一下id函数的具体信息如下: Help on built-in function id in module __builtin__: id(...) id(object) -> integer Return the i…
背景交代 在反爬圈子的一个大类,涉及的网站其实蛮多的,目前比较常被爬虫coder欺负的网站,猫眼影视,汽车之家,大众点评,58同城,天眼查......还是蛮多的,技术高手千千万,总有五花八门的反爬技术出现,对于爬虫coder来说,干!就完了,反正也996了~ 作为一个系列的文章,那免不了,依旧拿猫眼影视"学习"吧,为什么?因为它比较典型~ 猫眼影视 打开猫眼专业版,常规操作,谷歌浏览器,开发者工具,抓取DOM节点, https://piaofang.maoyan.com/?ver=no…
常见验证码 之前的博客中已经解决了一些常见验证码的问题,但是验证码是层出不穷的,目前解决验证码除了通过常规手段解决以外,还可以通过人工智能领域的深度学习去解决 深度学习?! 无疑对爬虫coder提高了N个量级的学习量.难道大公司识别验证码都需要自己去实现逻辑么? 带劲的验证码 12306验证码 12306绝对是验证码的一个顶级的存在,单独成为一类也不过分! 点触验证码 手势验证码 点选验证码 翻转验证码 还有各种其他风格,这些验证码深入的研究下去,都有解决办法,但是对一个Python爬虫工程师来…
今日的验证码之旅 今天你要学习的验证码采用通过第三方AI平台开放的OCR接口实现,OCR文字识别技术目前已经比较成熟了,而且第三方比较多,今天采用的是百度的. 注册百度AI平台 官方网址:http://ai.baidu.com/ 接下来申请 接下来创建一个简单应用之后,就可以使用了,我们找到 阅读文字识别相关文档 你需要具备基本的阅读第三方文档的能力,打开我们需要的文档 https://cloud.baidu.com/doc/OCR/OCR-API.html#.E9.80.9A.E7.94.A8…
作者:dave@http://krondo.com/a-poetry-transformation-server/  译者:杨晓伟(采用意译) 你可以从这里从头阅读这个系列. 新的服务器实现 这里我们要新写一个Twisted版的服务器.然后,再来讨论一些Deferred的新功能. 在第九.十部分,我们提出了诗歌转换引擎这个概念.由于其实现太过简单,因此我们用随机选择来模拟了可能会出现转换失败的情景.但如果转换引擎位于服务器端,那么当服务器宕机就会出现真实的转换失败的情景了. 因此,在这部分我们要…
图片比对 昨天的博客已经将图片存储到了本地,今天要做的第一件事情,就是需要在两张图片中进行比对,将图片缺口定位出来 缺口图片 完整图片 计算缺口坐标 对比两张图片的所有RBG像素点,得到不一样像素点的x值,即要移动的距离 def get_distance(self,cut_image,full_image): # print(cut_image.size) threshold = 50 for i in range(0,cut_image.size[0]): for j in range(0,c…
目录 验证码类型 官网最新效果 找个用极验证的网站 拼接验证码图片 编写自动化代码 核心run方法 模拟拖动方法 图片处理方法 初步运行结果 拼接图 图片存储到本地 @ 验证码类型 今天要搞定的验证码属于现在使用非常多的验证码的一种类型---极验证滑动验证码,关于这个验证码的详细说明查阅他的官网,https://www.geetest.com/ 把验证码做到这个地步,必须点赞了. 官网最新效果 官方DEMO最新的效果如下,按照验证码的更新频率,基本博客看完,验证码也更新了,不过套路依旧是相同的,…
滑动验证码介绍 本篇博客涉及到的验证码为滑动验证码,不同于极验证,本验证码难度略低,需要的将滑块拖动到矩形区域右侧即可完成. 这类验证码不常见了,官方介绍地址为:https://promotion.aliyun.com/ntms/act/captchaIntroAndDemo.html 使用起来肯定是非常安全的了,不是很好通过机器检测 如何判断验证码类型 这个验证码的标识一般比较明显,在页面源码中一般存在一个 nc.js 基本可以判定是阿里云的验证码了 <script type="text…
作者:dave@http://krondo.com/your-poetry-is-served/ 译者:杨晓伟(采用意译) 你可以从这里从头阅读这个系列. 诗歌下载服务器 到目前为止,我们已经学习了大量关于诗歌下载客户端的Twisted的知识,接下来,我们使用Twisted重新实现我们的服务器端.利益于Twisted的抽象机制,接下来你会发现我们前面已经几乎全部学习到这部分知识了.其实现源码在twisted-server-1/fastpoetry.py中.之所以称其为fastpoetry是因为其…
1. import # -*- coding: utf-8 -*- ## 引入新的包 import turtle import pickle # 文件操作 import tensorflow as tf # alias tf from time import time, localtime # 引入想要的功能 from time import * # 引入所有功能 ## 引入自定义包: 在Mac系统中,下载的python模块会被存储到外部路径site-packages,同样,我们自己建的模块也可…
关键字:[A Byte of Python v1.92(for Python 3.0)] [A Byte of Python3] 简明Python教程 Python教程 简明Python3教程  简明Python3教程<A Byte of Python3>是一本关于用Python3语言编程的书.可以作为初学这的入门教程.也可以供计算机相关人员参考. 本书可作为Python编程语言的指导或辅导.主要是针对新手的,当然,对于有经验的程序员也很有用.如果你所了解的计算机的知识就是如何保存文本文件,那…
A Byte of Python v1.92 (for Python 3.0) 官方下载地址,当前(20120730)  最新版本 1.92 基于Python3的 下载: http://files.swaroopch.com/python/byte_of_python_v192.pdf在线阅读:http://www.cnblogs.com/txw1958/archive/2012/12/10/A_Byte_of_Python3.html 简明Python3教程<A Byte of Python3…
Python经典教程<Python简明教程> 目录: 为什么Python 安装Python 体验Python Python数据类型 运算符与表达式 控制流 函数 模块 数据结构 解决问题 面向对象 输入输出 异常 标准库 更多的内容…
Python简明教程,此资源位于http://woodpecker.org.cn/abyteofpython_cn/chinese/ s=u'中文字符' #u表示unicode,使用u之后能正常显示中文 s='''多行文本 这是第二哈''' #'''表示多行注释.也可以用""" 布尔型:True,False docString:文档字符串.eg: # Filename : nice.py # encoding:utf8 def printMax(x, y): u'''输出两个…
今天看了知乎@萧井陌的编程入门指南,想重温一下 <python简明教程>,对global的用法一直不太熟练,在此熟练一下,并实践一下python中list.tuple.set作为参数的区别. 在函数内部定义变量时,他们与函数外部具有相同名称的其他变量没有任何关系,即变量名称对于函数来说是局部的,这称为变量的作用域,示例如下: def func_local(x): print 'x is', x x = 2 print 'Chanaged local x to',x x = 50 func_lo…
Python简明教程 MachinePlay关注 0.7072018.09.26 01:49:43字数 2,805阅读 9,287 Python一小时快速入门 1.Python简介   pylogo.png Python是一种相当高级的解释性程序设计语言,完成同一个任务C语言可能需要几千行代码Java要写100行,Python可能只需要20行. 用Python可以做什么?可以做日常任务,比如自动备份你的MP3:可以做网站,很多著名的网站包括YouTube就是Python写的:可以做网络游戏的后台…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 控制复杂性是计算机编程的本质. -- Brian Kernighan 了解了如何编写第一个Python 程序,接下来,我们来学习更多的Python 知识. 本篇内容,我们来介绍一些Python 基础概念. 1,注释 每种编程语言中都有注释,代码注释的主要作用是解释某段代码的含义,以供其他维护人员参考.Python 解释器在遇到注释时,会将其忽略,而不会当做代码来执行. 注释可分为单行注释和多行注释…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 如果你发现特殊情况太多,那你肯定是用错方法了. -- Carig Zerouni 当你在自己的电脑上安装好Python 后,就可以编写Python 程序了. 你可以使用Python 交互式终端,也可以将代码写在文件中,然后用Python 解释器来运行代码. 1,使用Python 交互式终端 Python 解释器就是一个交互式终端,所谓交互式终端,就是你输入的代码,会被立即执行,并将结果反馈给你.…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 人生苦短,我用Python. -- 龟叔T恤 Python 是一门解释型语言,所以要想运行Python 程序,首先需要搭建Python 环境,即安装Python 解释器.由于Python3 越来越普及,本教程中我们统一使用Python3.x 版本. Python 是一个跨平台语言,它支持Windows,Linux,Mac 系统.这里我们会介绍如何在这三种系统中安装Python. 1,在类Unix…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 代码能借用就借用. -- Tom Duff 目录 编程可分为面向过程编程和面向对象编程,它们是两种不同的编程方式,当然背后的思维方式也是不同的.面向过程编程是一种传统的编程方式,面向对象编程是一个更高级的编程方式. 1,面向过程编程 面向过程编程(POP)的重点在于过程二字. 面向过程比较好理解,就是按照人们通常的思维方式,在做一件事情的时候,将这件事情划分为多个步骤,一步一步来做. 面向过程编程…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 如果代码和注释不一致,那很可能两者都错了. -- Norm Schryer 目录 前几节我们已经介绍了Python 中的列表list,元组tuple 和 字典dict,本节来介绍Python 中的最后一种数据结构--集合set. >>> set <type 'set'> 1,Python 集合 Python 中的set 与 dict 很像,唯一的不同是,dict 中保存的是键值…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 如果你发现特殊情况太多,那很可能是用错算法了. -- Carig Zerouni 目录 前几节我们介绍了Python 中四种数据结构的特性和基本用法,本节介绍与数据结构相关的高级特性. 序列 迭代器 列表生成式 生成器 强制类型转换 1,序列 Python 序列是指,其中存放的元素是有序排列的,可用下标访问,字符串,列表,元组都是序列. 而字典与集合中的元素是无序排列的,因此一般不归在序列中. P…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 测试只能证明程序有错误,而不能证明程序没有错误. -- Edsger Dijkstra 目录 本节我们来介绍函数,在前边的章节我们已经接触了挺多函数了,比如print(),len() 等. 函数是编程语言中非常重要的概念,函数是一段可重复利用的,提供特定功能的代码段. 函数是一种模块化的手段,可提高代码的利用率,避免重复代码,便于使用,便于维护. Python 中,不仅提供了许多现成可用的内建函数…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 对于那些快速算法,我们总是可以拿一些速度差不多但是更容易理解的算法来替代它们. -- Douglas Jones 目录 高阶函数一般以函数为参数. 本节我们介绍Python 中三个方便的高阶函数,分别是: map reduce filter 如果你了解过分布式系统框架---Hadoop,你应该知道map/reduce 的概念. Python 中的map/reduce 函数与Hadoop 中的map…
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 正确的判断来源于经验,然而经验来源于错误的判断. -- Fred Brooks 目录 我们已经知道函数是一种重复利用代码的机制. 本节我们来介绍模块,Python 中的模块,也是一种重复利用代码的机制.我们可以将有特定功能的代码(比如函数,类等)写在模块中,供他人使用,便于重复利用,便于维护. 在前面的章节中,我们也接触过模块.Python 功能强大的一个重要的原因,就是它有各种方便使用的模块.…