(电脑烧掉了主板,地方上的所有门店全部关闭了,幸好现在京东还通物流,总算是进行把电脑拿回来了。对于一些东西无法实际操作真的是很难受,言归正传,说一下Wordcloud)


Wordcloud安装(全局安装)

  Wordcloud是python的一个第三方模块,其最大的特点就是可以通过我们的内容直接统计出单词出次数,随后以图形化的形式直观的展示给用户(按照大小,出现次数越多,显示的形状越大),这样就对于我们直观的进行查看显的特别方便了。

  对于Wordcloud的安装,一般我们首先会考虑到使用pip进行安装,如果你足够幸运,那就可以进行直接的安装,否则会出现各种各样的问题。不要想着去解决这些问题,否则你会更加的烦躁,所以,安装的方法应该是这样的。

  因为国内的网络访问国外延迟很高,所以在安装的过程中会出现一系列的超时问题,即使你是用了从镜像网站中进行下载暗账,也还是会出现其依赖的其他模块无法安装的问题。所以,这个时候我们可以使用国内的镜像加速器进行安装。比如使用阿里云的镜像加速器。可使用以下命令进行安装。

pip install --user wordcloud -i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com

  如果在安装过程中出现以下问题,则说明目前阿里云中没有与你python版本对应的wordcloud版本。

  那么你需要到 官方网址 或者 相关镜像网站 进行对应版本的下载,然后使用win+R进入cmd进行pip安装。值得注意的是,如果在此过程中出现一些其他模块的安装失败问题,则任然优先使用阿里云源加速器进行安装,否则到光放网站中或者进入相关镜像网站进行安装。安装成功如下图所示。


wordcloud使用

  根据以上安装,就可以正常使用wordcloud模块了。下面以一个小例子进行wordcloud的使用介绍。

  在使用慈云之前,我们应该知道的是词云是按照词云规范的模式进行处理的,即:数据处理的过程中,词云不能够通过内容出现的次数(数值)进行直接统计,而是将这些数值转换为单词,并且在同样的单词之间使用  空格  进行连接。

'''
@Description:
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
''' import wordcloud
SAVE_PATH = "test.png" def main():
data = dict(小明=10, 小花=30, 老王=100, 老李=70) # 统计结果
results = {} # 用来保存统计结果
for key, value in data.items(): # 使用元组进行键值对的取出
# print(key,value)
for num in range(value): # 通过value确定单词的比重
results[key] = results.get(key, " ") + " " + key.strip()
# clouds = WordCloud(
# collocations=
# )
clouds = wordcloud.WordCloud(
collocations=False, # 去掉重复的词
font_path="c:/Windows/Fonts/simfang.ttf", # 设置字体所在路径
background_color="white",
width=1000,
height=380) print(" ".join(results.values())) # 输出结果
clouds.generate_from_text(" ".join(results.values()))
clouds.to_file(SAVE_PATH) if __name__ == "__main__":
main()

  结果会生成一.png的图片,如下:、

'''
@Description: 
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
'''
import wordcloud
SAVE_PATH = "test.png"
def main():
    data = dict(小明=10, 小花=30, 老王=100, 老李=70)  # 统计结果
    results = {}  # 用来保存统计结果
    for key, value in data.items():  # 使用元组进行键值对的取出
        # print(key,value)
        for num in range(value):  # 通过value确定单词的比重
            results[key] = results.get(key, " ") + " " + key.strip()
    # clouds = WordCloud(
    #     collocations=
    # )
    clouds = wordcloud.WordCloud(
        collocations=False,  # 去掉重复的词
        font_path="c:/Windows/Fonts/simfang.ttf",  # 设置字体所在路径
        background_color="white",
        width=1000,
        height=380)
    print(" ".join(results.values()))  # 输出结果
    clouds.generate_from_text(" ".join(results.values()))
    clouds.to_file(SAVE_PATH)
if __name__ == "__main__":
    main()

Wordcloud(词云)安装使用以及vscode搭建虚拟环境的更多相关文章

  1. python爬虫——京东评论、jieba分词、wordcloud词云统计

    接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...

  2. 数字、字符串、列表、字典,jieba库,wordcloud词云

    一.基本数据类型 什么是数据类型 变量:描述世间万物的事物的属性状态 为了描述世间万物的状态,所以有了数据类型,对数据分类 为什么要对数据分类 针对不同的状态需要不同的数据类型标识 数据类型的分类 二 ...

  3. wordcloud词云模块

    wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...

  4. python3 wordcloud词云

    wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...

  5. WordCloud词云包的安装

    1,下载 https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 2,安装 (window环境安装) 找的下载文件的路径 安装 pip instal ...

  6. python 制作wordcloud词云

    pip install wordcloud 需要用到numpy  pillow matplotlib 安装完成以后 wordcloud_cli --text in.txt --imagefile ou ...

  7. jieba分词wordcloud词云

    1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...

  8. wordcloud词云

    借鉴别人的一个小例子,快速生成词云的代码: from wordcloud import WordCloud f = open(u'txt/AliceEN.txt','r').read() wordcl ...

  9. wordcloud词云--可视化

    import jieba import wordcloud f = open("新时代中国特色社会主义.txt", "r", encoding="gb ...

随机推荐

  1. SQL SERVER 实现相同记录为空显示(多列去除重复值,相同的只显示一条数据)

    sql server语句查询中碰到结果集有重复数据,需要把这个重复数据汇总成一条显示.其余则正常显示. 使用SQL内置函数 ROW_NUMBER() 加 PARTITION 完成 ROW_NUMBER ...

  2. 人脸照片自动生成游戏角色_ICCV2019论文解析

    人脸照片自动生成游戏角色_ICCV2019论文解析 Face-to-Parameter Translation for Game Character Auto-Creation 论文链接: http: ...

  3. AIoT 2020 年分析

    AIoT 2020 年分析 2020年,从智能手机到智能手表,从智能摄像头到智能汽车,随着AI.芯片.云计算.通信等基础技术的逐渐成熟,又一个行业来到了历史性的时刻--AIoT. 从"万物互 ...

  4. MindSpore技术理解(下)

    MindSpore技术理解(下) 4 GraphEngine 由于深度学习算法需要进行大量的计算,很多公司都设计了自己的深度学习专用处理器(如谷歌的张量处理器.阿里巴巴的含光等),华为也发布了自主设计 ...

  5. C#-防止用户输入具有风险的敏感字符

    最近有涉及到要防止用户在网页文本框中输入具有风险的敏感字符所以特地编写了一套针对用户输入的字符进行安全过滤的一个方法,在后台接收到用户输入的字符后调用执行该方法即可完成过滤操作,主要使用正则来匹配并替 ...

  6. PAT甲级 1093 Count PAT‘s (25 分) 状态机解法

    题目 原题链接 The string APPAPT contains two PAT's as substrings. The first one is formed by the 2nd, the ...

  7. .NET Core/.NET5/.NET6 开源项目汇总2:任务调度组件

    系列目录     [已更新最新开发文章,点击查看详细] 开源项目是众多组织与个人分享的组件或项目,作者付出的心血我们是无法体会的,所以首先大家要心存感激.尊重.请严格遵守每个项目的开源协议后再使用.尊 ...

  8. Java代码优化:使用构造函数和使用一个个setter的效率差别

    在对Java代码进行优化的时候,想方设法的要提高整体的效率,使用JProfiler看代码的时间占比,然后,看看哪些部分是可以优化的,减少运行时间的.下面有这么几个方向. 1. 能使用构造函数一步到位的 ...

  9. XML从入门到深入(超详细)

    一:什么是XML XML (eXtensible Markup Language)指可扩展标记语言,标准通用标记语言的子集,简称XML.是一种用于标记电子文件使其具有结构性的标记语言. XML可以标记 ...

  10. mybatis-generator的使用心得

    之前开发了一个亚健康测评系统,使用的是SSM框架,里面第一次使用到了mybatis-generator逆向代码生成工具,很方便,省去了基本的增删改查的mapper文件及sql的编写,还能避免错误,这里 ...