[本文出自天外归云的博客园] 题目要求: 1.统计英文文档中每个单词出现的次数. 2.统计结果先按次数降序排序,再按单词首字母降序排序. 3.需要考虑大文件的读取. 我的解法如下: import chardet import re # 大文件读取生成器 def read_big_file(f_path, chunk_size=100): f = open(f_path, 'rb') while True: # 每次读取指定内存大小的内容 chunk_data = f.read(chunk_siz…
import string path = 'waldnn' with open(path,'r') as text: words = [raw_word.strip(string.punctuation).lower() for raw_word in text.read().split()] words_index = set(words) counts_dict = {index:words.count(index) for index in words_index} for word in…
最近开始看一些整本整本的英文典籍,虽然能看个大概,但是作为四级都没过的我来说还是有些吃力,总还有一部分很关键的单词影响我对句子的理解,因为看的是纸质的,所以查询也很不方便,于是想来个突击,我想把程序单词收拢在一起学习一下,希望这样的更有针对性一些,因为你想,arbitrary (任意的,武断的)这样的单词不太可能会出现在技术文档上,学了这样的单词对理解英文技术文档没有太大帮助.所以今天花了几个小时研究了一下,发现是很可行的,实现也不算难.步骤主要是以下几点,第一:先搞定翻译接口.翻译的来源分为接…
# coding: utf-8 # In[32]: #import requests #from bs4 import BeautifulSoup #res = requests.get("http://www.guancha.cn/america/2017_01_21_390488_s.shtml") #res.encoding = 'utf-8' #soup = BeautifulSoup(res.text,'lxml') # In[66]: speech_new = open(&…
以CSDN为首,知乎其次,cnblog带路的一大批博客上充斥着大量低质量的编程入门教程,代码粗制滥造,毫无缩进,没有高亮,东抄西抄.初学者如果长期参照这种垃圾博客来解决问题,将会适得其反,走入歧途. 其实,初学者最应该看的,是编程软件的官方文档,是软件工具的官方文档,是开源项目的官方文档-- 但是鉴于有一些文档没有中文翻译,让不少不会英文的同学望而却步. 为此,我将会启动英文文档代查.翻译计划. 如果你想学习一门编程语言,但是它没有官方中文文档:如果你想实现一个功能,但是官方教程对API的描述是…
在教大家阅读英文文档之前,首先给大家明确一个概念.C#和.NET的区别? 有一定编程经验的同学应该多多少少知道这方面的概念,但是可能模糊,理解的不一定深刻.我在这里简单给出两者的基本定义: C#:仅仅就是一种编程语言,有它自己的语法和结构. .NET:是一个运行环境,里面包含了很多的库. 重点:我们使用C#在编程的时候可能已经注意到了,使用using可以进行很多基础库的引用,这里引用的就是.NET Framework中定义的各种库.当然也可以使用C#编写客户自定义的库. 这里就引出了今天我们要讲…
软件:Adobe Acrobat 网页:https://translate.google.cn/?tr=f&hl=zh-CN 方法:       第一步:用Adobe Acrobat 打开英文文档,另存为网页格式(.html)       第二步:打开谷歌翻译网页,加载.html文件       第三步:右键将翻译好的网页保存(另存为) 参考:https://blog.csdn.net/fuzimango/article/details/77419080 这个博主的方法翻译出的界面无法将鼠标放置…
JAVA Document:https://docs.oracle.com/en/java/javase/11/ 然后找到“Specifications”并点击 API Documentation 比如我们在别人的源码里看到了 方法[也叫函数]:  Scanner input = new Scanner(System.in); 所以搜索一下右上角 Scanner, 对比我们看到的源码里import,发现是java.util包里的,所以点击一下,出现如下 专业名词-中英对照表  All Imple…
Postgres-XL 是一个完全满足ACID的.开源的.可方便进行水平扩展的.多租户安全的.基于PostgreSQL的数据库解决方案. Postgres-XL 可非常灵活的应用在各类场景中,比如: OLAP(通过MPP并行化) OLTP OLAP & OLTP 结构化数据存储 Key-value存储,包括JSON格式 适用于不同的应用场景: 支持商业智能应用(数据仓库&数据集市),因为PGXL支持MPP(Massively Parallel Processing) Web2.0,数据库扩…
OpenStack Kilo版本发布 20英文文档OpenStack Kilo版本文档汇总:各个操作系统安装部署.配置文档.用户指南等文档 Kilo版部署 openstack[Kilo]入门 [准备篇]零:整体介绍 openstack[Kilo]入门 [准备篇]一: Ubuntu14.04远程连接(ssh安装) openstack[Kilo]入门 [准备篇]二:NTP安装 openstack[Kilo]入门 [准备篇]三:mysql(MariaDB)安装[控制节点] openstack[Kilo…