转载请注明原地址:http://www.cnblogs.com/connorzx/p/4170047.html 提出原因 基于余弦定理对文本和词汇的处理需要迭代的次数太多(具体见14章笔记),为了找到一个一步到位的办法,可以使用奇异值分解(SVD分解) 算法实现 建立一个M-by-N的矩阵A,其中行表示M篇文章,列表示N个词.aij表示第j个词在第i篇文章中出现的加权词频.将A进行奇异值分解,A=XBY,X为M-by-R矩阵,B为R阶方阵,Y为R-by-N矩阵.若R<<M,N,则存储量和计算量…
PDF下载 第一章 文字和语言 vs 数字和信息 数字.文字和自然语言一样,都是信息的载体,它们之间原本有着天然的联系.语言和数学的产生都是为了同一个目的-记录和传播信息.但是,直到半个多世纪前香农博士提出信息论,人们才开始把数学和信息系统自觉地联系起来. 信息:自然语言就是信息的一种,其实从最初的动物世界,再到以人类为主导的世界,都是在传播消息,哪怕是发出怪叫声也是一样的.这跟现在的信息传播模型是一样的. 起初的远古文明是用象形文字或壁画记录事件,但随着新鲜事物越来越多,财产越来越多,发现仅仅…
//向基类构造函数传递实参p491 class Bulk_item : public Item_base{ public: Bulk_item(,double disc_rate = 0.0): Item_base(book,sales_price),min_qty(qty),discount(disc_rate){} }; //在派生类构造函数中使用默认实参p491 class Bulk_item : public Item_base{ public: Bulk_item(,double di…
在比较安全上下文中的字符串(例如比较键)时,应尽量避免泄漏时序信息. 该TimeConstantComparer类可以帮助: var isEqual = TimeConstantComparer.IsEqual(key1, key2); 注意 从.NET Core 2.1开始,此功能通过CryptographicOperations.FixedTimeEquals内置 github地址…
1<数学之美>第1章 文字和语言 vs 数字和信息…
Linux就这个范儿 第15章 七种武器  linux 同步IO: sync.fsync与fdatasync   Linux中的内存大页面huge page/large page  David Cutler  Linux读写内存数据的三种方式 台湾作家林清玄在接受记者采访的时候,如此评价自己30多年写作生涯:“第一个十年我才华横溢,‘贼光闪现’,令周边黯然失色:第二个十年,我终于‘宝光现形’,不再去抢风头,反而与身边的美丽相得益彰:进入第三个十年,繁华落尽见真醇,我进入了‘醇光初现’的阶段,真正…
以下是我看<构建之法>1-5章列出来的知识点和一些自己对部分知识的理解以及一些吐槽...和感受 1.1 软件 = 程序 + 软件工程 (软件工程 = 软件 - 程序(我知道软件是什么,也知道程序是什么,但是就是不懂什么是软件工程啊...个人觉得 软件工程 - 程序 = 0 程序 = 数据结构 + 算法 (突然觉得至今为止我们所写的作业都只是程序而还没达到软件的程度啊..就缺软件工程了..软件工程到底是啥~?! ∴软件 = 数据结构 + 算法 + 软件工程 去百度百科看了一下:(有些就直接省略了…
<思考的乐趣:Matrix67数学笔记>第4章讲了几个统计学上的陷阱,由于现在流行的大数据与统计学很有渊源,所以认真读了这一章,在<大数据时代>中指出只考虑相关性就够了,而不考虑因果关系,从这几个例子上可以看出这种观点是非常的可怕. 1)因果关系颠倒: 去救火的消防员越多,火灾损失越大. 实际是因为火灾损失大,才会派很多的人去救火. 2)第三个因素影响2个事件显出了相关性 例一:冰淇淋销量增加,鲨鱼食人事件也会同时增加. 如果根据这个相关性,政府部门把冰淇淋销售点全部取缔就太可笑了…
1.排版 1.1 程序块要采用缩进风格编写, 缩进的空格数为4个.(说明: 对于由开发工具自动生成的代码可以有不一致)1.2 相对独立的程序块之间.变量说明之后必须加空行.1.3 循环.判断等语句中若有较长的表达式或语句, 则要进行适应的划分, 长表达式要在低优先级操作符处划分新行, 操作符放在新行之首.1.4 若函数或过程中的参数较长, 则要进行适当的划分.1.5 不允许把多个短语句写在一行中, 即一行只写一条语句.1.6 if.for.do.while.case.switch.default…
第15章 LinkedList类 LinkedList类是…