1) 博客开头给出自己的基本信息,格式建议如下:

学号:2017*****7193(保留前4位和后4位,中间用星号代替,避免泄露个人信息);
姓名:刘新飞,用你的真实姓名替代
我的码云仓库地址:[https://gitee.com/MrLiu199903/word_frequency/tree/master](https://gitee.com/MrLiu199903/word_frequency/tree/master

注意:务必给出跟人信息,评分需要个人信息。

2) 程序分析,对程序中的四个函数做简要说明。要求附上每一段代码及对应的说明。
引入正则表达式
利用upper()将所有的字母转换成大写。lower()转换成小写;但我个人喜欢大写,故,在这里全部转换为大写。同时也利用split()对字符串进行切割,方便统计
用for循环,将key存入list
统计输出,top10的单词(全是大写 的)

3) 性能分析结果及改进。



在性能分析测试中,总共执行了20000+次,执行时间是0.409秒修正过后。因为之前最开始的想法是用dbm进行读取,但是导入dbm的之后,程序起不来,就没在码云仓库中保留失败的作品

4) 程序运行命令、运行结果截图以及改进后的程序运行命令及结果截图 。

5) 给出你对此次任务的总结与反思。

反思:在刚开始的时候怎么运行都会报如上图的错误,后来仔细阅读作业说明,才知道需要进本次作业python代码的目录、并且现上百度查的怎么通过默认的cmd命令行进入D盘。
同时,在本次作业的实际操作中,我复习了以前在学徒制 学习的dbm和正则表达式
总结:每一门技术都是在活学活用中掌握的更扎实,在复习正则表达式的同时,参阅了http://www.runoob.com/python/python-reg-expressions.html的教程,同时也在其中学到了re.match与re.search的区别。

word_freq的更多相关文章

  1. RNN 入门教程 Part 2 – 使用 numpy 和 theano 分别实现RNN模型

    转载 - Recurrent Neural Networks Tutorial, Part 2 – Implementing a RNN with Python, Numpy and Theano 本 ...

  2. jieba

    # coding: utf-8 # ###jieba特性介绍 # 支持三种分词模式: # 精确模式,试图将句子最精确地切开,适合文本分析: # 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非 ...

  3. word2vec模型原理与实现

    word2vec是Google在2013年开源的一款将词表征为实数值向量的高效工具. gensim包提供了word2vec的python接口. word2vec采用了CBOW(Continuous B ...

  4. ipyparallel WordCount实现

            ipyparallel 之中,可以利用多个engine同时运行一个任务来加快处理的速度.在ipyparallel之中,集群被抽象为view,包括direct_view和balanced ...

  5. Recurrent Neural Network系列2--利用Python,Theano实现RNN

    作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORKS T ...

  6. R系列:分词、去停用词、画词云(词云形状可自定义)

    附注:不要问我为什么写这么快,是16年写的. R的优点:免费.界面友好(个人认为没有matlab友好,matlab在我心中就是统计软件中极简主义的代表).小(压缩包就几十M,MATLAB.R2009b ...

  7. 老李分享:《Linux Shell脚本攻略》 要点(七)

    老李分享:<Linux Shell脚本攻略> 要点(七)   1.显示给定文件夹下的文件的磁盘适用情况 [root@localhost program_test]# du -a -h ./ ...

  8. 老李分享:《Linux Shell脚本攻略》 要点(四)

    老李分享:<Linux Shell脚本攻略> 要点(四)   1.IP地址的正则表达式: [0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3} 2. ...

  9. R语言-文本挖掘

    ---恢复内容开始--- 案例1:对主席的新年致辞进行分词,绘制出词云 掌握jieba分词的用法 1.加载包 library(devtools) library(tm) library(jiebaR) ...

随机推荐

  1. lxml.etree.HTML(text) 解析HTML文档

    0.参考 http://lxml.de/tutorial.html#the-xml-function There is also a corresponding function HTML() for ...

  2. Consideration about improving mathematics study

    In this article, I’ll present my ideas about how to improve mathematics study, which are the forewor ...

  3. sql面试总结

    http://blog.csdn.net/a379850992/article/details/55655495

  4. Tomcat目录结构详解

    1.bin: 该目录下存放的是二进制可执行文件,如果是安装版,那么这个目录下会有两个exe文件:tomcat6.exe.tomcat6w.exe,前者是在控制台下启动Tomcat,后者是弹出UGI窗口 ...

  5. 【Java】 剑指offer(11) 矩阵中的路径

    本文参考自<剑指offer>一书,代码采用Java语言. 更多:<剑指Offer>Java实现合集   题目 请设计一个函数,用来判断在一个矩阵中是否存在一条包含某字符串所有字 ...

  6. Windows API教程文件系统

    本篇文章主要介绍了"Windows API教程文件系统",主要涉及到Windows API教程文件系统方面的内容,对于Windows API教程文件系统感兴趣的同学可以参考一下. ...

  7. SDOI2018:荣誉称号

    题解: https://files.cnblogs.com/files/clrs97/title-solution.pdf Code: #include<cstdio> #include& ...

  8. idea搜索jar中的类

    ctrl+n快捷键

  9. vue 安装及使用

    一,  vue.js 2.0 1, cnpm install vue-cli -g 全局安装 2, 运行vue查看安装是否成功(创建vue-cli目录: vue init webpack demo) ...

  10. js一些代码

    1判断金额正则 var reg = /(^[1-9]([0-9]+)?(\.[0-9]{1,2})?$)|(^(0){1}$)|(^[0-9]\.[0-9]([0-9])?$)/; var money ...