(电脑烧掉了主板,地方上的所有门店全部关闭了,幸好现在京东还通物流,总算是进行把电脑拿回来了。对于一些东西无法实际操作真的是很难受,言归正传,说一下Wordcloud)


Wordcloud安装(全局安装)

  Wordcloud是python的一个第三方模块,其最大的特点就是可以通过我们的内容直接统计出单词出次数,随后以图形化的形式直观的展示给用户(按照大小,出现次数越多,显示的形状越大),这样就对于我们直观的进行查看显的特别方便了。

  对于Wordcloud的安装,一般我们首先会考虑到使用pip进行安装,如果你足够幸运,那就可以进行直接的安装,否则会出现各种各样的问题。不要想着去解决这些问题,否则你会更加的烦躁,所以,安装的方法应该是这样的。

  因为国内的网络访问国外延迟很高,所以在安装的过程中会出现一系列的超时问题,即使你是用了从镜像网站中进行下载暗账,也还是会出现其依赖的其他模块无法安装的问题。所以,这个时候我们可以使用国内的镜像加速器进行安装。比如使用阿里云的镜像加速器。可使用以下命令进行安装。

pip install --user wordcloud -i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com

  如果在安装过程中出现以下问题,则说明目前阿里云中没有与你python版本对应的wordcloud版本。

  那么你需要到 官方网址 或者 相关镜像网站 进行对应版本的下载,然后使用win+R进入cmd进行pip安装。值得注意的是,如果在此过程中出现一些其他模块的安装失败问题,则任然优先使用阿里云源加速器进行安装,否则到光放网站中或者进入相关镜像网站进行安装。安装成功如下图所示。


wordcloud使用

  根据以上安装,就可以正常使用wordcloud模块了。下面以一个小例子进行wordcloud的使用介绍。

  在使用慈云之前,我们应该知道的是词云是按照词云规范的模式进行处理的,即:数据处理的过程中,词云不能够通过内容出现的次数(数值)进行直接统计,而是将这些数值转换为单词,并且在同样的单词之间使用  空格  进行连接。

'''
@Description:
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
''' import wordcloud
SAVE_PATH = "test.png" def main():
data = dict(小明=10, 小花=30, 老王=100, 老李=70) # 统计结果
results = {} # 用来保存统计结果
for key, value in data.items(): # 使用元组进行键值对的取出
# print(key,value)
for num in range(value): # 通过value确定单词的比重
results[key] = results.get(key, " ") + " " + key.strip()
# clouds = WordCloud(
# collocations=
# )
clouds = wordcloud.WordCloud(
collocations=False, # 去掉重复的词
font_path="c:/Windows/Fonts/simfang.ttf", # 设置字体所在路径
background_color="white",
width=1000,
height=380) print(" ".join(results.values())) # 输出结果
clouds.generate_from_text(" ".join(results.values()))
clouds.to_file(SAVE_PATH) if __name__ == "__main__":
main()

  结果会生成一.png的图片,如下:、

'''
@Description: 
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
'''
import wordcloud
SAVE_PATH = "test.png"
def main():
    data = dict(小明=10, 小花=30, 老王=100, 老李=70)  # 统计结果
    results = {}  # 用来保存统计结果
    for key, value in data.items():  # 使用元组进行键值对的取出
        # print(key,value)
        for num in range(value):  # 通过value确定单词的比重
            results[key] = results.get(key, " ") + " " + key.strip()
    # clouds = WordCloud(
    #     collocations=
    # )
    clouds = wordcloud.WordCloud(
        collocations=False,  # 去掉重复的词
        font_path="c:/Windows/Fonts/simfang.ttf",  # 设置字体所在路径
        background_color="white",
        width=1000,
        height=380)
    print(" ".join(results.values()))  # 输出结果
    clouds.generate_from_text(" ".join(results.values()))
    clouds.to_file(SAVE_PATH)
if __name__ == "__main__":
    main()

Wordcloud(词云)安装使用以及vscode搭建虚拟环境的更多相关文章

  1. python爬虫——京东评论、jieba分词、wordcloud词云统计

    接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...

  2. 数字、字符串、列表、字典,jieba库,wordcloud词云

    一.基本数据类型 什么是数据类型 变量:描述世间万物的事物的属性状态 为了描述世间万物的状态,所以有了数据类型,对数据分类 为什么要对数据分类 针对不同的状态需要不同的数据类型标识 数据类型的分类 二 ...

  3. wordcloud词云模块

    wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...

  4. python3 wordcloud词云

    wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...

  5. WordCloud词云包的安装

    1,下载 https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 2,安装 (window环境安装) 找的下载文件的路径 安装 pip instal ...

  6. python 制作wordcloud词云

    pip install wordcloud 需要用到numpy  pillow matplotlib 安装完成以后 wordcloud_cli --text in.txt --imagefile ou ...

  7. jieba分词wordcloud词云

    1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...

  8. wordcloud词云

    借鉴别人的一个小例子,快速生成词云的代码: from wordcloud import WordCloud f = open(u'txt/AliceEN.txt','r').read() wordcl ...

  9. wordcloud词云--可视化

    import jieba import wordcloud f = open("新时代中国特色社会主义.txt", "r", encoding="gb ...

随机推荐

  1. THINKPHP_(1)_修改TP源码,支持对中文字符串按拼音进行排序。

    问题:TP从服务器数据中取出的collection数据,当进一步在网页中进行分页显示时,需要调用order函数,实现类似如下图的排序. 当点击页面中的相关内容时,实现对服务器数据进行重排,就要调用TP ...

  2. 3D惯导Lidar SLAM

    3D惯导Lidar SLAM LIPS: LiDAR-Inertial 3D Plane SLAM 摘要 本文提出了最*点*面表示的形式化方法,并分析了其在三维室内同步定位与映射中的应用.提出了一个利 ...

  3. nvGRAPH三角形计数和遍历示例

    nvGRAPH三角形计数和遍历示例 #include " stdlib.h" #include" inttypes.h" #include" stdi ...

  4. JS使用Enter事件将输入的字符倒叙输出

    在JavaScript中执行当用户按下Enter键位时将用户输入的字符倒叙输出! HTML代码: <body> <form id="form1" runat=&q ...

  5. JUC 并发编程--07 阻塞队列版本的 生产者消费者(不使用synchronized和 lock),也有一些疑惑,最终解惑

    直接上代码: 前提是你已经 熟悉了原子类,volatile,和阻塞队列 public class JucPCdemo03 { /** * 阻塞队列的应用: 这里实现的生产者消费者,生产一个消费一个 * ...

  6. mybatis学习——使用注解开发

    前言: 一个语句既可以通过 XML 定义,也可以通过注解定义.不过,由于 Java 注解的一些限制以及某些 MyBatis 映射的复杂性,要使用大多数高级映射(比如:嵌套联合映射),仍然需要使用 XM ...

  7. 摆脱鼠标之Dos学习

    2015/12/24 for循环 1,创建文件 http://blog.csdn.net/wangxingbao4227/article/details/17009447 关于for循环的总结,很详细 ...

  8. 我的物联网大学【第二章】:Luat的出世

    壹 启动火种 有一位软件行业的大神,名字叫做许小刚. 小刚是一位憨厚的年轻的码农,嵌入式.后端.前端,无所不能,是一个很牛的物联网全栈工程师,也是一家物联网软件公司的创始人兼CEO. 有次跟我.老陆. ...

  9. EVB_Air724UG_A13开发板使用指南

      Air724 是上海合宙物联网于2020年3月下旬发布的一款基于UIS8910DM芯片组的物联网通讯模块. 模块通讯性能优越,符合Cat1通讯标准,支持最大下行速率 10Mbps 和最大上行速率5 ...

  10. noip模拟9[斐波那契·数颜色·分组](洛谷模拟测试)

    这次考试还是挺好的 毕竟第一题被我给A了,也怪这题太简单,规律一眼就看出来了,但是除了第一题,剩下的我只有30pts,还是菜 第二题不知道为啥我就直接干到树套树了,线段树套上一个权值线段树,然后我发现 ...