# -*- coding:utf-8 -*- # import numpy as np #import numpy 和from numpy import *是不一样的 # # # import numpy,如果你使用numpy的属性都需要在前面加上numpy # # # # from numpy import * ,则不需要加入numpy # # # # 后者不建议使用,如果你下次引用和numpy里的函数一样的情况,就会出现命名冲突 # # 举个例子:将列表[1,2,3,4,5,6,7]生成nu…
虽然把text转成全部量化是可以的,但是还是需要把text转成numpy的形式(这个是必须掌握的) 在将数据输入到分类器之前,必须将待处理数据的格式改变为分类器可以接受的格式. 数据规范化.数据归一化.数据算法化.输出误差分析 代码: # -*- coding:utf-8 -*- from numpy import * def file2matrix(filename): fr = open(filename) numberOfLines = len(fr.readlines()) #get t…
(1)k-近邻算法是分类数据最简单最有效的方法. (2)在将数据输入到分类器之前,必须将待处理数据的格式改变为分类器可以接受的格式. (3)所有的推荐模型都可以使用这个算法,只要将结果量化就行了,主要是要考虑权重的设计.# -*- coding:utf-8 -*-#数字型聚类分析from numpy import *import operatordef createDataSet(): group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labe…
一.算法介绍 1. 算法是什么 算法是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制.也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出.如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题.不同的算法可能用不同的时间.空间或效率来完成同样的任务.一个算法的优劣可以用空间复杂度与时间复杂度来衡量. 2.时间复杂度 在计算机科学中,算法的时间复杂度是一个函数,它定性描述了该算法的运行时间.这是一个关于代表算法输入值…
一.多层语法糖本质 """ 语法糖会将紧挨着的被装饰对象名字当参数自动传入装饰器函数中""" def outter(func_name): print('加载outter') def wrapper(*args, **kwargs): print('执行了wrapper') res = func_n…
前言 本系列教程基本就是摘抄<Python机器学习基础教程>中的例子内容. 为了便于跟踪和学习,本系列教程在Github上提供了jupyter notebook 版本: Github仓库:https://github.com/Holy-Shine/Introduciton-2-ML-with-Python-notebook 系列教程总目录 Python机器学习基础教程 引子 假设有一名植物学爱好者对她发现的鸢尾花的品种很感兴趣.她收集了每朵鸢尾花的一些测量数据:花瓣的长度和宽度以及花萼的长度和…
KNN分类算法(先验数据中就有类别之分,未知的数据会被归类为之前类别中的某一类!) 1.KNN介绍 K最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法. 机器学习,算法本身不是最难的,最难的是: 1.数学建模:把业务中的特性抽象成向量的过程: 2.选取适合模型的数据样本. 这两个事都不是简单的事.算法反而是比较简单的事. 本质上,KNN算法就是用距离来衡量样本之间的相似度. 2.算法图示 ◊ 从训练集中找到和新数据最接近的k条记录,然后根据多数类来决定新数据类…
1.简介                                                                                               关于Python的知识,其实自己很早就想单独开一个系列出来,但是碍于自己太懒了,到现在都还没执行.最近觉得自己实在是没有脸面在拖延下去了,遂将自己学习的整理一下,便于以后自己翻看.此前花过一段时间学习了有些Python的基础,做了一些简单的笔记,记录在印象笔记里.后期买了几本关于Python的书籍,但…
现在,越来越多的公司面试以及考验面试对算法要求都提高了一个层次,从现在,我讲每日抽出时间进行5+1算法题讲解,5是指基础题,1是指1道中等偏难.希望能够让大家熟练掌握python的语法结构已经一些高级函数的应用.这些题目是在某些刷题的网站上登记的有水平的题目.这里如果有需要input的简单题,就略去了输出结果.如果时间充裕,则就会增加每日更多习题. 一:基础算法题10道 1.判断用户输入的年份是否为闰年 题目解析: (1)问题分析:能被4整除但不能被100整除的年份为普通闰年,能被400整除的年…
一:基础算法题5道 1.阿姆斯特朗数 如果一个n位正整数等于其各位数字的n次方之和,则称该数为阿姆斯特朗数.判断用户输入的数字是否为阿姆斯特朗数. (1)题目分析:这里要先得到该数是多少位的,然后再把每一位的数字截取出来,把各位数字的n次方之和和该数一起判断即可.(2)算法分析:python中有len()函数可以得到一个字符串的长度,因此需要先把一个正整数转化为正整数字符串.然后从高位向低位截取(也可以反过来).或者高效算法利用for循环切片. 从高位到低位:用正整数除了10的n次方,得到的商就…