import numpy as np import matplotlib.pyplot as plt from sklearn.svm import LinearSVC from sklearn.linear_model import Lasso from sklearn.model_selection import train_test_split from sklearn.feature_selection import SelectFromModel from sklearn.datase…
这篇文章主要讲解使用Sklearn进行数据预处理,我们使用Kaggle中泰坦尼克号事件的数据作为样本. 读取数据并创建数据表格,查看数据相关信息 import pandas as pd import numpy as np from pandas import Series,DataFrame data = pd.read_csv('tanic_train.csv')#导入进来的是dataframe格式 #data 可以打开data的具体信息,是dataframe的格式 #data.info()…