1.利用jieba分词,排除停用词stopword之后,对文章中的词进行词频统计,并用matplotlib进行直方图展示 # coding: utf-8 import codecs import matplotlib.pyplot as plt import jieba # import sys # reload(sys) # sys.setdefaultencoding('utf-8') from pylab import mpl mpl.rcParams['font.sans-serif']…
1.词云图 词云图,也叫文字云,是对文本中出现频率较高的"关键词"予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨. 先看几个词云图 简书签约作者标签词云 全国政协常委会工作报告词云图 2.推荐几个不错的词云图工具 Tagul Tagul云可以自定义字体.词云的形状(有爱心.BUS.雪人.人像.UFO等),颜色等,做出来的词云图很酷炫,为网站访问者提供良好的用户体验.用户可以在网站做好词云图,然后印在衣服.杯子.鼠标垫等地方,自己设计…
利用Python编写简单网络爬虫实例3 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://bbs.51testing.com/forum.php”中特定url,通过分析发现,目标url同其它url的关系如下   目标url存在子页面中的文章中,随机分布,我们要把它找出来 python脚本 #!/usr/bin/env python # -*- coding:utf-8 -*- from urllib.request…
利用Python编写简单网络爬虫实例2 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://www.51testing.com/html/index.html”中特定url,通过分析发现,目标url同其它url的关系如下   目标url存在子页面中的文章中,随机分布,我们要把它找出来 python脚本 #!/usr/bin/env python # -*- coding:utf-8 -*- from urllib.r…
利用python进行简单的图像处理:包括打开,显示以及保存图像 利用PIL处理 PIL(python image library) 是python用于图片处理的package.但目前这个package已经停止更新,因此使用Pillow,它由PIL发展而来. 首先要安装Pillow,运行如下命令: pip install Pillow 打开,显示以及保存图像: from PIL import Image img = Image.open('lena.png) #open the image img…
python制作简单excel统计报表3之将mysql数据库中的数据导入excel模板并生成统计图 # coding=utf-8 from openpyxl import load_workbook from openpyxl.chart import ( AreaChart, Reference ) import MySQLdb class GaokaoExport(object): def __init__(self): self.wb = load_workbook('./static/t…
python制作简单excel统计报表2之操作excel的模块openpyxl简单用法 # coding=utf-8 from openpyxl import Workbook, load_workbook from openpyxl.drawing.image import Image from openpyxl.styles import Font,colors from datetime import datetime import MySQLdb class ExcelUtils(obj…
第一步:首先需要安装工具python 第二步:在电脑cmd后台下载安装如下工具: (有一些是安装好python电脑自带有哦) 有一些会出现一种情况就是安装不了词云展示库 有下面解决方法,需看请复制链接查看:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 第三步: 1.准备好你打算统计的文件,命名为 家.txt,保存到桌面 2.准备一个做背景的图片,命名为girl.jpg,同样保存到桌面 第四步:插入代码 import re # 正则表达…
一.环境以及注意事项 1.windows10家庭版 python 3.7.1 2.需要使用到的库 wordcloud(词云),jieba(中文分词库),安装过程不展示 3.注意事项:由于wordcloud默认是英文不支持中文,所以需要一个特殊字体 simsum.tff.下载地址: https://s3-us-west-2.amazonaws.com/notion-static/b869cb0c7f4e4c909a069eaebbd2b7ad/simsun.ttf 请安装到C:\Windows\F…
import xlrd import jieba import pymysql import matplotlib.pylab as plt from wordcloud import WordCloud from collections import Counter import numpy as np def getExcelData(excel,txt): readbook = xlrd.open_workbook(excel) sheet = readbook.sheet_by_inde…