二值化 设置一个condition,把连续型的数据分类两类.比如Age,大于30,和小于30. from sklearn.preprocessing import Binerize as Ber x = data_2.iloc[:,0].values.reshpe(-1,1) #提取数据 trans = Ber(threshold = 30).fit_transform(x) trans 这是x中>30的设置为1,其他的设置为0. 标签 有时数据可能需要对数据进行分箱化处理,或者给不同的数据设置…