机器学习入门-数值特征-进行多项式变化(将特征投影到高维度上) 1.PolynomialFeatures(将数据变化为多项式特征)

函数说明：

1. PolynomialFeatures(degree=2, interaction_only=False, include_bias=False)

参数说明:degree=2,表示多项式的变化维度为2，即^2, interaction_only表示是否只使用a*b, include_bias是否添加一列全部等于1的偏置项

对数据进行多项式变化，将两个特征a, b如果是进行^2多项式变化操作，那么就相当于多出来了3个特征即a^2, a*b, b^2

一般我们在使用支持向量机的时候，由于数据在低纬度上的不可分，因此我们需要对数据做一个高维度的映射，以使得数据能够更加的可分

数据说明：我们使用了游戏数据中的攻击和防御两个特征用来构造多项式特征，使用的多项式为2

代码：

第一步:导入数据

第二步：分离出['Attack', 'Defense']两个特征

第三步：使用 PolynomialFeatures 进行多项式的变化，

第四步：使用pd.DataFrame对获得的列表添加列名，用于展示

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

poke_df = pd.read_csv('datasets/Pokemon.csv', encoding='utf-8')

att_de = poke_df[['Attack', 'Defense']]

# 对att_de进行两两特征之间的多项式特征扩展，可以认为是把特征投向高维

from sklearn.preprocessing import PolynomialFeatures

#degree 表示多项式的维度，即^2， interaction_only表示是否仅使用a*b,include_bias表示是否引入偏执项1

po = PolynomialFeatures(degree=2, interaction_only=False, include_bias=False)

att_de_po = po.fit_transform(att_de)

print(att_de_po[:5])

# 使用pd.DataFrame将数据转换为pd格式

att_de_po_pd = pd.DataFrame(att_de_po, columns=['Attack', 'Defense', 'Attack^2', 'Att_Def', 'Defense^2'])

print(att_de_po_pd.head())

变化后的参数特征

机器学习入门-数值特征-进行多项式变化(将特征投影到高维度上) 1.PolynomialFeatures(将数据变化为多项式特征)的更多相关文章

机器学习入门-数值特征-数据四分位特征 1.quantile(用于求给定分数位的数值) 2.plt.axvline(用于画出竖线) 3.pd.pcut(对特征进行分位数切分，生成新的特征)
函数说明: 1. .quantile(cut_list) 对DataFrame类型直接使用,用于求出给定列表中分数的数值,这里用来求出4分位出的数值 2. plt.axvline() # 用于画 ...
机器学习入门-数值特征-对数据进行log变化
对于一些标签和特征来说,分布不一定符合正态分布,而在实际的运算过程中则需要数据能够符合正态分布因此我们需要对特征进行log变化,使得数据在一定程度上可以符合正态分布进行log变化,就是对数据使用n ...
机器学习入门-数值特征-进行二值化变化 1.Binarizer(进行数据的二值化操作)
函数说明: 1. Binarizer(threshold=0.9) 将数据进行二值化,threshold表示大于0.9的数据为1,小于0.9的数据为0 对于一些数值型的特征:存在0还有其他的一些数二 ...
机器学习入门-数值特征-连续数据离散化(进行分段标记处理) 1.hist(Dataframe格式直接画直方图)
函数说明: 1. .hist 对于Dataframe格式的数据,我们可以使用.hist直接画出直方图对于一些像年龄和工资一样的连续数据,我们可以对其进行分段标记处理,使得这些连续的数据变成离散化就 ...
机器学习入门-数值特征-数字映射和one-hot编码 1.LabelEncoder(进行数据自编码) 2.map(进行字典的数字编码映射) 3.OnehotEncoder(进行one-hot编码) 4.pd.get_dummies(直接对特征进行one-hot编码)
1.LabelEncoder() # 用于构建数字编码 2 .map(dict_map) 根据dict_map字典进行数字编码的映射 3.OnehotEncoder() # 进行one-hot编码 ...
从Iris数据集开始---机器学习入门
代码多来自<Introduction to Machine Learning with Python>. 该文集主要是自己的一个阅读笔记以及一些小思考,小总结. 前言在开始进行模型训练之 ...
Adapter数据变化改变现有View的实现原理及案例
首先说说Adapter详细的类的继承关系.例如以下图 Adapte为接口它的实现类的对象作为AdapterView和View的桥梁,Adapter是装载了View(比方ListView和girdVie ...
机器学习入门09 - 特征组合 (Feature Crosses)
原文链接:https://developers.google.com/machine-learning/crash-course/feature-crosses/ 特征组合是指两个或多个特征相乘形成的 ...
web安全之机器学习入门——3.1 KNN/k近邻
目录 sklearn.neighbors.NearestNeighbors 参数/方法基础用法用于监督学习检测异常操作(一) 检测异常操作(二) 检测rootkit 检测webshell skl ...

随机推荐

还原MongoDB dump备份出来的Bson数据
集合名数据库名备份文件位置 mongorestore --collection people --db accounts dump/accounts/people.bson
浏览器唤起APP的功能
http://blog.html5funny.com/2015/06/19/open-app-from-mobile-web-browser-or-webview/ http://panli.mu.g ...
Spring-framework应用程序启动loadtime源码分析笔记（一）
1,实例化DefaultListableBeanFactory DefaultListableBeanFactory是AnnotationConfigApplicationContext的组件,Def ...
Dubbo(3)Dubbo admin管理控制台
dubbo-admin管理控制台: 可以管理服务,消费,以及其他配置: 在dubbo项目的zip包中有个demo-admin项目,可以打成war包,发布到tomcat运行里面: 我这里将dubbo-a ...
C语言强化——指针
目录相关概念数组与函数栈空间和堆空间的差异指针常量与常量指针指针数组与数组指针二级指针二级指针的传递二级指针的偏移(索引式排序) 相关概念指针的大小,在32系统上是4个字节:在64位 ...
[UE4]移动小地图
让玩家角色永远处于小地图的中心位置. 一.将RoundMiniMap的StaticMiniMap使用Canvas Panel包裹,StaticMiniMap的锚点Anchors设置为中心对齐二.新建 ...
[UE4]寻找敌人
结对编程——paperOne基于java的四则运算功能改进
项目成员:张金生张政由于新的需求,原本使用JSP的实现方式目前改为Java实现,即去除了B/S端. 需求分析: 1.四则运算要满足整数运算.分数运算两种: 2.运算题目随机,并且可以打印题 ...
C# Microsoft.Office不存在空间名称Interop和Excel
在实际开发过程中,我们经常会对Excel表进行操作.相信大家都都已经很熟悉C#操作Excel的步骤:添加引用->COM->Microsoft Office Excel 11 Object. ...
Android---页面跳转
1.首先在一个布局文件(.XML)中绘画了一个跳转按钮(id为btn1): <Button android:id="@+id/btn1" an ...

机器学习入门-数值特征-进行多项式变化(将特征投影到高维度上) 1.PolynomialFeatures(将数据变化为多项式特征)

机器学习入门-数值特征-进行多项式变化(将特征投影到高维度上) 1.PolynomialFeatures(将数据变化为多项式特征)的更多相关文章

随机推荐

热门专题