网络上使用sklearn生成决策树的资料很多,这里主要说明遇见标量数据的处理. 经查验参考资料,sklearn并非使用了课上以及书上讲的ID3算法,而是选择了CART,该算法生成二叉树:scikit-learn使用了一种优化的CART算法,要求元数据为数值型(要能转换为np.float32类型的矩阵),因为该实现同时可以做回归分析.然而,题目数据中有天气等标量数据,所以还要进行转化,这里采用了sklearn中的LabelEncoder来将n个标量转化为1至n-1的整数.将数据训练完毕后,安装并使…
view视图文件中的input等输入框必须含有name属性,不然控制器里的动作formCollection是没有值的,就是没有name属性,后台获取不到值…
检测某元素是否含有某属性 if(typeof($("#aid").attr("rel"))=="undefined")…
在将 json 字符串转为对象时,如果对象含有泛型,在进行转换时需要指明泛型类型. 1. 对象只含有一个泛型属性时 1.1  代码 /** * @Describe: * @Author: chenfan * @Date: 2019/5/9 19:15 */ @Data /** * 含有泛型属性的对象 */ class OneGeneric<E>{ E e; String ss; } @Data /** * 泛型对象 */ class KeyMessage{ String kk; } publi…
官方英文文档地址:http://scikit-learn.org/dev/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression 导包: from sklearn.linear_model import LogisticRegression 使用: classifier = LogisticRegression(solver='sag',max_i…
决策树 熵的定义 如果一个随机变量X的可能取值为X={x1,x2,..,xk},其概率分布为P(X=x)=pi(i=1,2,...,n),则随机变量X的熵定义为\(H(x) = -\sum{p(x)logp(x)}=\sum{p(x)log{\frac{1}{p(x)}}}\).需要注意的是,熵越大,随机变量的不确定性就越大. 当n = 2的时候,\(H(p)=-plogp-(1-p)log(1-p)\)也就是交叉熵的损失函数. 条件熵 条件熵主要是用来计算,在莫一列数据X选中的条件下,其标签Y…
含有Date类型属性的对象,转化为Json,Date属性并不是时间戳格式. 解决方法: 使用Jackson的注解@JsonFormat,添加到对象属性上方即可. 我们的北京时间会相差8个小时,因为我们是东八区(北京时间).所以我们在格式化的时候要指定时区(timezone ). Jackson的依赖如下: <dependency> <groupId>com.fasterxml.jackson.core</groupId> <artifactId>jackso…
两种方式,但稍有区别 1,in 运算符 1 2 3 var obj = {name:'jack'}; alert('name' in obj); // --> true alert('toString' in obj); // --> true 可看到无论是name,还是原形链上的toString,都能检测到返回true. 2,hasOwnProperty 方法 1 2 3 var obj = {name:'jack'}; obj.hasOwnProperty('name'); // --&g…
我想判断input里面是否有disabled.或者选中未选中的selected  checked 属性时,需要用  prop()  方法,返回的结果是 true 或 false . attr()这个方法用来设置和获取值.…
# -*- coding: UTF-8 -*- import jieba import os import random from sklearn.naive_bayes import MultinomialNB from matplotlib import pyplot as plt def TextProcessing(folder_path, test_size=0.2): """ 处理路径下的所有文本,并划分训练集和测试集,在训练集上,生成无重复词语集并按出现次数从大…