摘要:偶然机会接触到python语音,感觉语法简单.功能强大,刚好朋友分享了一个网课<python 爬虫与数据可视化>,于是在工作与闲暇时间学习起来,并做如下课程笔记整理,整体大概分为4个部分(1.python基础知识 2.爬虫基础知识 3.数据提取与存储 4.数据分析与可视化),入门级课程. 一.python的背景介绍.安装与配置.pycharm的安装与配置.ipython的安装.pip install的使用 二.python的变量与数据类型 数据类型:字符串.数字(整数.浮点数).布尔类型…
前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取t.cn/A6Zvjdun 前一阵子,由于肖战的“227事件”微博和朋友圈都被刷屏,起因在与肖战的粉丝发现在AO3作品库平台收录关于肖战的同人作品,认为该部作品影响了肖战的形象,遂向有关部门举报,最终告知知名同人网站A03(Archive of our own)作品库无法被访问. 这也对爱好同人作品的读者与…
我的新书,<基于股票大数据分析的Python入门实战>,预计将于2019年底在清华出版社出版. 如果大家对大数据分析有兴趣,又想学习Python,这本书是一本不错的选择.从知识体系上来看,这本书的内容涵盖了开发Python企业级项目所需的知识点,包括但不限于Python基础语法知识.基于Pandas的大数据分析技术.基于Matplotlib的可视化编程技术.Python爬虫技术和基于Django的网络编程技术,甚至还在本书的最后,讲述了机器学习编程技术. 这本书的大多数范例程序是基于股票分析的…
一.爬取老番茄B站数据 前几天开发了一个python爬虫脚本,成功爬取了B站李子柒的视频数据,共142个视频,17个字段,含: 视频标题,视频地址,视频上传时间,视频时长,是否合作视频,视频分区,弹幕数,播放量,点赞数,投币量,收藏量,评论数,转发量,实时爬取时间 基于这个Python爬虫程序,我更换了up主的UID,把李子柒的uid换成了老番茄的uid,便成功爬取了老番茄的B站数据.共393个视频,17个字段,字段同上. 这里展示下爬取到的前20个视频数据: 基于爬取的老番茄B站数据,用pyt…
一.数据分析的目的(利用大数据量数据分析,帮助人们做出战略决策) 二.什么是matplotlib? matplotlib: 最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建,能将数据进行可视化.更直观的呈现.使数据更加客观.更具说服力. 三.matplotlib模块的使用基本要点,根据不同的需求选择不同的图表,常用如折现图.散点图.柱状图等. 四.matplotlib能够绘制折线图,散点图,柱状图,直方图,箱线图,饼图等,但是,我们需要知道不同的…
本文源码:GitHub·点这里 || GitEE·点这里 一.数据可视化 1.基础概念 数据可视化,是关于数据视觉表现形式的科学技术研究.其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽取出来的信息,包括相应信息单位的各种属性和变量. 如果说的实际贴切的话:系统开发中常见的数据报表统计,将数据用图表或表格的形式呈现出来,帮助运营或者决策人员了解这些数据的规律或者价值,就是简单的可视化应用. 从开发角度来看,把系统中的核心数据,用一定的手段进行统计,在借助一些精美的图表样式,展示出来,或…
前提条件: 熟悉认知新的编程工具(jupyter notebook) 1.安装:采用pip的方式来安装Jupyter.输入安装命令pip install jupyter即可: 2.启动:安装完成后,我们可在如下目录找到jupyter-notebook这个应用:双击启动 如下图所示: 3.打开浏览器编译器 至此编程工具准备完毕. 数据可视化实战教程: import pymongo import charts client = pymongo.MongoClient('localhost',2701…
一.爬虫的定义.爬虫的分类(通用爬虫.聚焦爬虫).爬虫应用场景.爬虫工作原理(最后会发一个完整爬虫代码) 二.http.https的介绍.url的形式.请求方法.响应状态码 url的形式: 请求头: 常见响应状态码(可利用响应状态码判断响应状态assert response.status_code == 200): 三.数据请求,获取响应(requests模块,详细使用方法api文档) 中文文档api:http://docs.python-requests.org/zh_CN/latest/in…
一.python中的模块 模块的安装:pip install 模块名 导入模块与函数:import requests . from pymongo import MongoClient json模块的使用 json字符串转python数据类型:json.loads()  反之 json.dumps() 二.文件操作 打开文件:f=open("文件名","r")  #文件访问模式(只读方式打开文件r,写w,追加a,以二进制文件格式打开文件rb,写wb,追加ab) 读取…
时间序列 需求:将一组字符顺序添加到时间序列中 实现:定义时间序列类TimeSeries,包含静态类Entry表示序列类中的各项,以及add,get,iterator,entry方法 TimeSeries.java 1 import java.util.ArrayList; 2 import java.util.Iterator; 3 import java.util.Map; 4 import java.util.TreeMap; 5 import java.util.concurrent.T…