上周倒腾了下 javafx,本来是做平时成绩系统.跟老师提了一下 javafx,他突然兴起,发了个统计中文和英文单词并以直方图显示的实验......只给两三天的期限,笑着说考验我们的潜力SOS,于是带着组里一共三人花了一天半时间做了下来. 主要界面如下 没选文本时,如果没勾选完就点开始分析会显示提示 分析文本文档 只有一个功能,就是选择本地 .txt 文件,选择文本语言和最低频次,然后显示直方图统计结果. 试了下大的 .txt 文档,超出界面后面的就无法显示,x轴和柱形条对不齐,还没改这个bug…
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不清楚配置可看<Hadoop之词频统计小实验初步配置> 3)本文由于过长,无法一次性上传.其相邻相关的博文,可参见<Hadoop的改进实验(中文分词词频统计及英文词频统计) 博文目录结构>,以阅览其余三篇剩余内容文档. (五)单机伪分布的英文词频统计Python&Streamin…
最近部门成立了一个python学习小组,旨在让大家在做项目中开始成长起来,于是老大就给布置了第一个小任务:代码统计工具,具体的需求如下: 需求: . 能够统计指定目录下C++程序的代码行数. . C++程序文件包括.cpp和.h文件. . 如果指定目录下有子目录,需要能够递归遍历所有子目录. . 能够区分注释和代码. . 不用考虑语句跨行问题. . 输出.cpp..h文件个数.代码行数.注释行数及处理时间. . 基于python3开发. 乍一看,感觉好像有点难度,一下要处理这么多的功能,又是统计…
Apple最近在iTunesConnect里最新发布了官方统计工具,提供了现有友盟统计平台和自有统计平台无法统计的数据,具有自己的独有特点,尤其是下面几个最让人头疼的流量分析转化,可以在App Analytics里得以解决,例如: 推广链接转化 网站流量来源 由于苹果自己的统计方式和其他平台有所区别,且文档只提供了英文版,故整理了常见的Q&A并翻译,其中问题的翻译,会保持和Apple自己的中文翻译一致,方便大家对照查看,在回答的翻译,有的方便理解,会改用咱们自己常说的术语.(PS:稍稍鄙视下Ap…
以下是关于小说的中文词频统计 这里有三个文件,分别为novel.txt.punctuation.txt.meaningless.txt. 这三个是小说文本.特殊符号和无意义词 Python代码统计词频如下: import jieba # jieba中文分词库 # 从文件读入小说 with open('novel.txt', 'r', encoding='UTF-8') as novelFile: novel = novelFile.read() # 将小说中的特殊符号过滤 with open('…
Python实现代码统计工具--终极加速篇 声明 本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对比.实测表明,CPLineCounter在统计精度和性能方面均优于其他同类统计工具.以千万行代码为例评测性能,CPLineCounter在Cpython和Pypy环境下运行时,比国外统计工具cloc1.64分别快14.5倍和29倍,比国内SourceCounter3.4分别快1.8倍和3.6倍. 运…
目录 Python实现C代码统计工具(四) 标签: Python 计时 持久化 声明 运行测试环境 一. 自定义计时函数 1.1 整个程序计时 1.2 代码片段计时 1.3 单条语句计时 二. 性能优化 Python实现C代码统计工具(四) 标签: Python 计时 持久化 声明 本文介绍若干种有别于cProfile/profile模块的Python程序计时方法,并对<Python实现C代码统计工具(三)>中的C代码统计工具进行性能优化.本文所述的方法也适用于其他Python脚本. 运行测试…
目录 Python实现C代码统计工具(二) 声明 一. 问题提出 二. 代码实现 三. 效果验证 Python实现C代码统计工具(二) 标签: Python 代码统计 声明 本文将对<Python实现C代码统计工具(一)>中的C代码统计工具进行重构,以应对各种使用场景. 一. 问题提出 此前实现的C代码统计工具较为简陋,仅能遍历和分析当前目录及其子目录下的代码文件并输出统计报告. 在实际使用中,可能期望支持同时统计多个目录和(或)文件,并可指定遍历深度.当文件总数较少且文件路径较长时,期望支持…
1.安装eclipse 准备 eclipse-dsl-luna-SR2-linux-gtk-x86_64.tar.gz 安装 1.解压文件. 2.创建图标. ln -s /opt/eclipse/eclipse /usr/bin/eclipse #使符号链接目录 vim /usr/share/applications/eclipse.desktop #创建一个  Gnome 启动 添加如下代码: [Desktop Entry] Encoding=UTF-8 Name=Eclipse 4.4.2…
美国语言协会对美国人日常使用的英语单词做了一份详细的统计,按照日常使用的频率做成了一张表,称为COCA词频表.排名越低的单词使用频率越高,该表可以用来统计词汇量. 如果你的词汇量约为6000,那么这张表频率6000以下的单词你应该基本都认识.(不过国内教育平时学的单词未必就是他们常用的,只能说大部分重合) 我一直有个想法,要是能用COCA词频表统计一本小说中所有的词汇都是什么等级的,然后根据自己的词汇量,就能大致确定这本小说是什么难度,自己能不能读了. 学习了C++的容器和标准库算法后,我发现这…