wordcloud词云--可视化
import jieba
import wordcloud f = open("新时代中国特色社会主义.txt", "r", encoding="gbk") #只读.txt文件。这里一定注意是gbk!!!,而不是utf-8(如果出错,请把encoding删除)
t = f.read()
f.close()
ls = jieba.lcut(t) txt = " ".join(ls)
w = wordcloud.WordCloud(
width=1000, height=700,
background_color="white",
font_path="MSYH.ttc" #没有设置字体可能出现,词云的结果均为方框。建议设置MSYH.ttc/MSYH.TTC(微软雅黑)
)
w.generate(txt)
w.to_file("wordcloud1.png") #在程序当前目录,生成图片wordcloud1.png

import jieba
import wordcloud
from scipy.misc import imread mask = imread("chinamap.jpg") #设置背景图片chinamap.jpg
excludes = { } f = open("新时代中国特色社会主义.txt", "r", encoding="gbk") #只读.txt文件。这里一定注意是gbk!!!,而不是utf-8(如果出错,请把encoding删除)
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls) w = wordcloud.WordCloud(
width = 550, height = 500,
background_color = "white",
font_path = "MSYH.ttc", mask = mask #没有设置字体可能出现,词云的结果均为方框。建议设置MSYH.ttc/MSYH.TTC(微软雅黑)
) w.generate(txt)
w.to_file("wordcloud2.png") #在程序当前目录,生成图片wordcloud2.png

wordcloud词云--可视化的更多相关文章
- 用Python做词云可视化带你分析海贼王、火影和死神三大经典动漫
对于动漫爱好者来说,海贼王.火影.死神三大动漫神作你肯定肯定不陌生了.小编身边很多的同事仍然深爱着这些经典神作,可见"中毒"至深.今天小编利用Python大法带大家分析一下这些神作 ...
- python爬虫——京东评论、jieba分词、wordcloud词云统计
接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...
- 数字、字符串、列表、字典,jieba库,wordcloud词云
一.基本数据类型 什么是数据类型 变量:描述世间万物的事物的属性状态 为了描述世间万物的状态,所以有了数据类型,对数据分类 为什么要对数据分类 针对不同的状态需要不同的数据类型标识 数据类型的分类 二 ...
- wordcloud词云模块
wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...
- python3 wordcloud词云
wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...
- Python 词云可视化
最近看到不少公众号都有一些词云图,于是想学习一下使用Python生成可视化的词云,上B站搜索教程的时候,发现了一位UP讲的很不错,UP也给出了GitHub上的源码,是一个很不错的教程,这篇博客主要就是 ...
- jieba分词wordcloud词云
1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...
- wordcloud词云
借鉴别人的一个小例子,快速生成词云的代码: from wordcloud import WordCloud f = open(u'txt/AliceEN.txt','r').read() wordcl ...
- python 制作wordcloud词云
pip install wordcloud 需要用到numpy pillow matplotlib 安装完成以后 wordcloud_cli --text in.txt --imagefile ou ...
随机推荐
- [C++ Mind Map] class and memory
class and memory
- [SoapUI] Loop a test with different sets of data
- easyui 获取当前页签选中的名称
parent.parent.$("#tabs").tabs('getSelected').panel('options').title == "收藏夹管理"
- 常用数据库连接池 (DBCP、c3p0、Druid) 配置说明.RP
1. 引言 1.1 定义 数据库连接是一种关键的有限的昂贵的资源,这一点在多用户的网页应用程序中体现得尤为突出.对数据库连接的管理能显著影响到整个应用程序的伸缩性和健壮性,影响到程序的性能指标.数据库 ...
- AJAX和DHTML
DHTML: (动态的html)本身不是一门新语言,而是一门新技术,包含以下 html . css . dom . js AJAX : 也是一门新技术包含 html . css. dom ...
- SpringMVC 细节学习
使用Spring MVC,配置DispatcherServlet是第一步 DispatcherServlet是前置控制器,配置在web.xml文件中的 .拦截匹配的请求,Servlet拦截匹配规则要 ...
- python基础借鉴
这是一个链接 这个是egon的链接 吴沛其的博客
- spring mvc 集成hibernate步骤
今天从头把hibernate集成进入springMVC框架中,把过程记录下来. 1.首先要在监听器配置文件中加入hibernate支持,如下: <?xml version="1.0&q ...
- [GO]goroutine的使用
package main import ( "fmt" "time" ) func NewTask() { for true { fmt.Println(&qu ...
- 网络编程释疑之:单台服务器上的并发TCP连接数可以有多少
曾几何时我们还在寻求网络编程中C10K问题的解决方案,但是现在从硬件和操作系统支持来看单台服务器支持上万并发连接已经没有多少挑战性了.我们先假设单台服务器最多只能支持万级并发连接,其实对绝大多数应用来 ...