广义来说,有三种机器学习算法 1. 监督式学习 工作机制:这个算法由一个目标变量或结果变量(或因变量)组成.这些变量由已知的一系列预示变量(自变量)预测而来.利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数.这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度.监督式学习的例子有:回归.决策树.随机森林.K – 近邻算法.逻辑回归等. 2.非监督式学习 工作机制:在这个算法中,没有任何目标变量或结果变量要预测或估计.这个算法用在不同的组内聚类分析.这种分析方式被广泛地用来细分…
详见 F:\工程硕士\d电子书\26 数据挖掘 小结: 1. C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法.  C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足: 2) 在树构造过程中进行剪枝: 3) 能够完成对连续属性的离散化处理: 4) 能够对不完整数据进行处理. C4.5算法有如下优点:产生的分类规则易于理解,准确率较高.其缺点是:在构造树的过…
机器学习之决策树(ID3)算法与Python实现 机器学习中,决策树是一个预测模型:他代表的是对象属性与对象值之间的一种映射关系.树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值.决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出. 数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测. 一.决策树与ID3概述1.决策树 决策树,其结构和树非常相似,因此得其名决策树.决…
<背景>  滤镜处理是图像处理中一种非常常见的方法.比如photoshop中的滤镜效果,除了自带的滤镜,还扩展了很多第三方的滤镜效果插件,可以对图像做丰富多样的变换:很多手机app实现了实时滤镜功能,最有名的当属Instagram. PIL中主要涉及到卷积滤镜,其原理是针对数字图像的像素矩阵,使用一个nxn的方形矩阵做滤波器(即卷积核kernel,常见的如3x3,5x5等),对该图像像素进行卷积遍历(即截取和卷积核同等大小的像素矩阵进行卷积运算),每一个输出像素都是一定区域像素按一定权重组合计…
<机器学习实战>kMeans算法(K均值聚类算法) 机器学习中有两类的大问题,一个是分类,一个是聚类.分类是根据一些给定的已知类别标号的样本,训练某种学习机器,使它能够对未知类别的样本进行分类.这属于supervised learning(监督学习).而聚类指事先并不知道任何样本的类别标号,希望通过某种算法来把一组未知类别的样本划分成若干类别,这在机器学习中被称作 unsupervised learning (无监督学习).在本文中,我们关注其中一个比较简单的聚类算法:k-means算法. k…
1.选择排序 选择排序是一种简单直观的排序算法.它的原理是这样:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的后面,以此类推,直到所有元素均排序完毕.算法实现如下: #找到最小的元素 def FindSmall(list): min=list[0] for i in range(len(list)): if list[i]<min: min=list[i] return min #选择排序 def Selec…
#!/usr/bin/python # -*- coding: utf-8 -*- from numpy import * import operator def createDataSet(): '创建数据集' group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,1.1]]) labels=["A","A","B","B"] return group,labels def classify(i…
1.根据索引来获取元素* 创建一个索引列表ind,用来装载索引,当numpy数据是一维数据时:一个索引对应的是一个元素具体的例子如下: import numpy as np # 数据是一维数据时:索引对应的是一个元素 x = np.array([10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160]) ind1 = [3, 5, 9] print("根据一维索引获取对应元素的值,生成一维的numpy数据:&qu…
前言 在编写JavaScript代码的时候存在一些对于数组的方法,可能涉及的页面会很多,然后每次去写一堆代码.长期下去代码会特别的繁多,是时候进行一波封装了,话不多说开始书写优美的代码 代码已上传github,需要的欢迎star(https://github.com/Xieguoiang...). 关于数组一些方法的封装 1.数组去重 `上文提到的Set的封装` //ES6新增的Set数据结构,类似于数组,但是里面的元素都是唯一的 ,其构造函数可以接受一个数组作为参数 //ES6中Array新增…
1.冒泡排序: 比较相邻的两个数,如果前一个数大于后一个数,就将这两个数换位置.每一次遍历都会将本次遍历最大的数冒泡到最后.为了将n个数排好序,需要n-1次遍历.如果某次遍历中,没有调整任何两个相邻的数的位置关系,说明此时数组已排好序,可以结束程序. 2.选择排序 第i轮遍历arr[0:n-i]选出最大的数,与arr[n-i]互换. 3.插入排序 数组的前面部分已经排好序,要把当前数字插入到前面已排好序的数组的相应位置.可能有人会有疑问为什么默认数组前面部分已排好序?是怎么排好序的?是因为当排序…