(电脑烧掉了主板,地方上的所有门店全部关闭了,幸好现在京东还通物流,总算是进行把电脑拿回来了。对于一些东西无法实际操作真的是很难受,言归正传,说一下Wordcloud)


Wordcloud安装(全局安装)

  Wordcloud是python的一个第三方模块,其最大的特点就是可以通过我们的内容直接统计出单词出次数,随后以图形化的形式直观的展示给用户(按照大小,出现次数越多,显示的形状越大),这样就对于我们直观的进行查看显的特别方便了。

  对于Wordcloud的安装,一般我们首先会考虑到使用pip进行安装,如果你足够幸运,那就可以进行直接的安装,否则会出现各种各样的问题。不要想着去解决这些问题,否则你会更加的烦躁,所以,安装的方法应该是这样的。

  因为国内的网络访问国外延迟很高,所以在安装的过程中会出现一系列的超时问题,即使你是用了从镜像网站中进行下载暗账,也还是会出现其依赖的其他模块无法安装的问题。所以,这个时候我们可以使用国内的镜像加速器进行安装。比如使用阿里云的镜像加速器。可使用以下命令进行安装。

pip install --user wordcloud -i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com

  如果在安装过程中出现以下问题,则说明目前阿里云中没有与你python版本对应的wordcloud版本。

  那么你需要到 官方网址 或者 相关镜像网站 进行对应版本的下载,然后使用win+R进入cmd进行pip安装。值得注意的是,如果在此过程中出现一些其他模块的安装失败问题,则任然优先使用阿里云源加速器进行安装,否则到光放网站中或者进入相关镜像网站进行安装。安装成功如下图所示。


wordcloud使用

  根据以上安装,就可以正常使用wordcloud模块了。下面以一个小例子进行wordcloud的使用介绍。

  在使用慈云之前,我们应该知道的是词云是按照词云规范的模式进行处理的,即:数据处理的过程中,词云不能够通过内容出现的次数(数值)进行直接统计,而是将这些数值转换为单词,并且在同样的单词之间使用  空格  进行连接。

'''
@Description:
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
''' import wordcloud
SAVE_PATH = "test.png" def main():
data = dict(小明=10, 小花=30, 老王=100, 老李=70) # 统计结果
results = {} # 用来保存统计结果
for key, value in data.items(): # 使用元组进行键值对的取出
# print(key,value)
for num in range(value): # 通过value确定单词的比重
results[key] = results.get(key, " ") + " " + key.strip()
# clouds = WordCloud(
# collocations=
# )
clouds = wordcloud.WordCloud(
collocations=False, # 去掉重复的词
font_path="c:/Windows/Fonts/simfang.ttf", # 设置字体所在路径
background_color="white",
width=1000,
height=380) print(" ".join(results.values())) # 输出结果
clouds.generate_from_text(" ".join(results.values()))
clouds.to_file(SAVE_PATH) if __name__ == "__main__":
main()

  结果会生成一.png的图片,如下:、

'''
@Description: 
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
'''
import wordcloud
SAVE_PATH = "test.png"
def main():
    data = dict(小明=10, 小花=30, 老王=100, 老李=70)  # 统计结果
    results = {}  # 用来保存统计结果
    for key, value in data.items():  # 使用元组进行键值对的取出
        # print(key,value)
        for num in range(value):  # 通过value确定单词的比重
            results[key] = results.get(key, " ") + " " + key.strip()
    # clouds = WordCloud(
    #     collocations=
    # )
    clouds = wordcloud.WordCloud(
        collocations=False,  # 去掉重复的词
        font_path="c:/Windows/Fonts/simfang.ttf",  # 设置字体所在路径
        background_color="white",
        width=1000,
        height=380)
    print(" ".join(results.values()))  # 输出结果
    clouds.generate_from_text(" ".join(results.values()))
    clouds.to_file(SAVE_PATH)
if __name__ == "__main__":
    main()

Wordcloud(词云)安装使用以及vscode搭建虚拟环境的更多相关文章

  1. python爬虫——京东评论、jieba分词、wordcloud词云统计

    接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...

  2. 数字、字符串、列表、字典,jieba库,wordcloud词云

    一.基本数据类型 什么是数据类型 变量:描述世间万物的事物的属性状态 为了描述世间万物的状态,所以有了数据类型,对数据分类 为什么要对数据分类 针对不同的状态需要不同的数据类型标识 数据类型的分类 二 ...

  3. wordcloud词云模块

    wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...

  4. python3 wordcloud词云

    wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...

  5. WordCloud词云包的安装

    1,下载 https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 2,安装 (window环境安装) 找的下载文件的路径 安装 pip instal ...

  6. python 制作wordcloud词云

    pip install wordcloud 需要用到numpy  pillow matplotlib 安装完成以后 wordcloud_cli --text in.txt --imagefile ou ...

  7. jieba分词wordcloud词云

    1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...

  8. wordcloud词云

    借鉴别人的一个小例子,快速生成词云的代码: from wordcloud import WordCloud f = open(u'txt/AliceEN.txt','r').read() wordcl ...

  9. wordcloud词云--可视化

    import jieba import wordcloud f = open("新时代中国特色社会主义.txt", "r", encoding="gb ...

随机推荐

  1. 微信架构 & 支付架构(下)

    微信架构 & 支付架构(下) 3. 管理网络请求 首先看看原来 iOS 处理支付网络请求的缺陷: 原来支付的请求,都是通过一个单例网络中心去发起请求,然后收到回包后,通过抛通知,或者调用闭包的 ...

  2. ONNX 实时graph优化方法

    ONNX 实时graph优化方法 ONNX实时提供了各种图形优化来提高模型性能.图优化本质上是图级别的转换,从小型图简化和节点消除,到更复杂的节点融合和布局优化. 图形优化根据其复杂性和功能分为几个类 ...

  3. Excel创建序列号1000个

    一.输入1,并且选择 二.开始-填充 三.选择序列 四.选择列-等差序列-步张值输入1 终止值输入1000 点击确定 五.查看结果,选中这一列 六.快捷键 Ctrl+下键 则跳转到最下方,上键则是最上 ...

  4. postman之内建变量的基础应用

    一.Postman有以下内建变量,适合一次性使用:{{$guid}}//生成GUID{{$timestamp}}//当前时间戳{{$randomInt}}//0-1000的随机整数 简单应用举例: 二 ...

  5. 编译原理-DFA与正规式的转化

  6. SpringBoot基础系列之自定义配置源使用姿势实例演示

    [SpringBoot基础系列]自定义配置源的使用姿势介绍 前面一篇博文介绍了一个@Value的一些知识点,其中提了一个点,@Value对应的配置,除了是配置文件中之外,可以从其他的数据源中获取么,如 ...

  7. 内核、dns、网卡配置

    升级内核(安装新版软件包) rpm -ivh kernel-3.10.0-123.1.2.el7.x86_64.rpm 二.配置永久IP地址,子网掩码,网关地址   /etc/sysconfig/ne ...

  8. Centos7 安装 Keepalived

    目标: Keeplaived 简单模拟测试一下Nginx 故障切换前言:C7 默认的 1.3.5 似乎有点问题,改装 keepalived-2.0.7 1:安装 Nginx 和确认 (略)2:安装配置 ...

  9. 【NX二次开发】Block UI 整数表

    属性说明 常规         类型 描述     BlockID     String 控件ID     Enable     Logical 是否可操作     Group     Logical ...

  10. .Net RabbitMQ实战指南——HTTP API接口调用

    RabbitMQ Management插件还提供了基于RESTful风格的HTTP API接口来方便调用.一共涉及4种HTTP方法:GET.PUT.DELETE和POST.GET方法一般用来获取如集群 ...