1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌握一个函数 (2).jieba分词的原理 Jieba分词依靠中文词库 利用一个中文词库,确定汉字之间的关联概率 汉字间概率大的组成词组,形成分词结果 除了分词,用户还可以添加自定义的词组 2.jieba库使用说明 (1).jieba分词的三种模式 精确模式.全模式.搜索引擎模式 精确模式:把文本精确…
1.打开cmd安装jieba库和 matplotlib. 2.打开python,输入代码.代码如下: from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba def create_word_cloud(filename): text = open("孙子兵法.txt","r",encoding='GBK').read() #打开自己想要的文本 wordlist = ji…
from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba # 生成词云 def create_word_cloud(filename): with open('hongloumong.txt',encoding='utf-8') as f: text = f.read() wordlist = jieba.cut(text, cut_all=True) # 结巴分词 wl = " ".joi…
一.基本数据类型 什么是数据类型 变量:描述世间万物的事物的属性状态 为了描述世间万物的状态,所以有了数据类型,对数据分类 为什么要对数据分类 针对不同的状态需要不同的数据类型标识 数据类型的分类 二.数字类型 整型(int) 作用 表示人的年龄 / 身份证号 定义 age = 21 pringt(age, type(age)) # 打印结果:21 <class 'int'> # 或者: age = int(21) print(age, type(age)) # 打印结果:21 <cla…
接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv399&productId=4560435&score=0&sortType=5&page=0&pageSize=10&isShadowSku=0&fold=1’ 重点是productId——产品id.page——页码.pag…
python字符串/列表/字典互相转换 目录 字符串与列表 字符串与字典 列表与字典 字符串与列表 字符串转列表 1.整体转换 str1 = 'hello world' print(str1.split('这里传任何字符串中没有的分割单位都可以,但是不能为空')) # 输出:['helloworld'] 2.分割 str2 = "hello world" list2 = list(str2) print(list2) #输出:['h', 'e', 'l', 'l', 'o', ' ',…
wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud##调用wordcloud中的WordCloud子模块 1.配置模块参数 2.加载文本.generate() 3.输出词云文件.to_file(" ") from wordcloud import WordCloud from imageio import imread import matp…
wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距离 background_color='white',#背景颜色 min_font_size=3,max_font_size=None,#显示的最小,最大的字体大小 max_words=200,#显示的词的最大个数 ranks_only=None,#是否只是排名 prefer_horizontal=…
词云 词云是啥?词云突出一个数据可视化,酷炫.以前以为很复杂,不想python已经有成熟的工具来做词云.而我们要做的就是准备关键词数据,挑一款字体,挑一张模板图片,非常非常无脑.准备好了吗,快跟我一起动手吧 模块 本案例基于python3.6, 相关模块如下,安装都是直接 pip install <模块名>: wordcloud 作用如其名.本例核心模块,它把我们带权重的关键词渲染成词云 matplotlib 绘图模块,主要作用是把wordcloud生成的图片绘制出来并在窗口展示 numpy…
python基础(一): 运算符: 算术运算: 除了基本的+ - * / 以外,还需要知道 :  // 为取整除 返回的市商的整数部分 例如: 9 // 2  ---> 4  , 9.0 //  2.0 --->4.0   %  为取余数  返回的是除法的余数  没有余数则为0  例如: 3 % 3 ---> 0 , 有余数:6 % 3 --->2 逻辑运算符: and , or , not 比较运算符: == 判断两个数是否相等 , != 判断两个数是否不相等 ,  > ,…