孤荷凌寒自学python第七十七天开始写Python的第一个爬虫7 (完整学习过程屏幕记录视频地址在文末) 今天在上一天的基础上继续完成对我的第一个代码程序的书写. 今天的学习仍然是在纯粹对docx模块的探索和研究. 一.对docx模块的学习笔记 (一)docx文档中的色彩控制 from docx.shared import RGBColor 此方法用于将三个数值(十进制,十六进制的三个数都行,三原色)生成色彩对象 用法是: RGBColor(红色值,绿色值,蓝色值) (二)为文字指定色彩,今天…
孤荷凌寒自学python第六十七天初步了解Python爬虫初识requests模块 (完整学习过程屏幕记录视频地址在文末) 从今天起开始正式学习Python的爬虫. 今天已经初步了解了两个主要的模块: requests BeautifulSoup 一.主要模块的安装 (一)requests pip install requests (如果失败,多试几次即可) (二)BeautifulSoup pip install BeautifulSoup4 BeautifulSoup4已经指明了模块的版本号…
孤荷凌寒自学python第五十七天初次尝试使用python来连接远端MongoDb数据库 (完整学习过程屏幕记录视频地址在文末) 今天是学习mongoDB数据库的第三天.感觉这个东西学习起来还是那么困难,今天是第一次尝试使用Python代码来连接远端数据库,然而今天并没有成功. 一.首先下载安装Python需要的第三方库: pip install pymongo 在windows的命令行窗口中输入以上命令即可. 二.然后通过引用此模块,就可以进行连接 我今天的测试如下(没有成功) ``` fro…
孤荷凌寒自学python第四十七天通用跨数据库同一数据库中复制数据表函数 (完整学习过程屏幕记录视频地址在文末) 今天继续建构自感觉用起来顺手些的自定义模块和类的代码. 今天打算完成的是通用的(至少目前操作四种数据库)在同一数据库内复制数据表的方法函数. 此设想最初我自我感觉都非常简单,然而事实是关系型数据库统一使用的sql语言在各家其实是完全不同的! 一.了解清楚了我目前研究的四种关系型数据库对同一数据库中数据表的复制操作的sql语句的异同也效果局限 (一)Access 数据库与mssql数据…
孤荷凌寒自学python第三十七天python的文件与内存变量之间的序列化与反序列化 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 一.什么是序列化与反序列化 序列化是指将内存中的数据进行指定规则的格式梳理,使之方便按一定格式保存到文件中.我的理解就是数据在文件中的保存的结构. 反序列化是指将磁盘中文件的保存的结构读取出来,然后转换为内存中的数据,并且可以在屏幕上输出为人可阅读的格式内容. 二.pickle模块 pickle模块是Python 内置的序列化与反序列化类,保存到文件时,是…
孤荷凌寒自学python第二十七天python的datetime模块及初识datetime.date模块 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 一.datetime模块 datetime模块包含以下子模块: (一) 表示时刻点 的模块 datetime.date datetime.time datetime.datetime datetime.datetime_CAPI (二) 表示时间间隔(时间长度)的模块 datetime.delta (三) 表示时区信息的模块 datet…
孤荷凌寒自学python第十七天初识Python的函数 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 函数是能够完成指定运算并返回运算结果的代码块.是结构化编程重要的结构. 我首先发现python的函数定义非常简洁,没有定义的修饰词,如多数语言中用到的函数定义的修饰词private public 等在python中是不存在!! 一.python函数的定义格式 def 函数名([参数列表]): 函数体 就是函数内具体执行的代码块 参数列表,是指函数的形式参数,简称为“形参”,一个函数可以…
孤荷凌寒自学python第八十六天对selenium模块进行较详细的了解 (今天由于文中所阐述的原因没有进行屏幕录屏,见谅) 为了能够使用selenium模块进行真正的操作,今天主要大范围搜索资料进行对selenium模块的学习,并且借2019年的新年好运居然在今天就来了,还在学习Python的过程中就接到一个任务,完成了第一个真正有实用价值的作品,大大增强了信心,也对Python爬取内容,操纵网页的能力有了真切的体会. 一.首先真诚感谢以下文章作者的无私分享: 查找到html页面标签对象方法的…
孤荷凌寒自学python第八十五天配置selenium并进行模拟浏览器操作1 (完整学习过程屏幕记录视频地址在文末) 要模拟进行浏览器操作,只用requests是不行的,因此今天了解到有专门的解决方案:selenium模块及与火狐浏览器的配合使用. 一.环境配置 (一).安装selenium模块 pip install selenium C:\WINDOWS\system32>pip install selenium Collecting selenium Downloading https:/…
孤荷凌寒自学python第八十四天搭建jTessBoxEditor来训练tesseract模块 (完整学习过程屏幕记录视频地址在文末) 由于本身tesseract模块针对普通的验证码图片的识别率并不高,据说需要进行专门针对具体某一型号的验证码图片的训练才可以,因此今天的学习重点是搭建jTessBoxEditor环境来进行tesseract训练数据的训练和生成. 是完全参照以下博客内容来进行的: https://www.cnblogs.com/zhongtang/p/5555950.html 具体…