数据预处理-特征编码与离散化
特征编码
1、OneHotEncoder
sklearn.preprocessing.OneHotEncoder
preprocessing.OneHotEncoder( n_values=‘auto’, #‘auto’,int或int数组,每个特征的取值个数。 categorical_features=‘all’, #指定将哪些功能视为分类 dtype=
将包含?个取值的离散型特征转换成?个二元特征(取值为0或1) 优点:经过One-Hot编码之后,不同的原始特征之间拥有相同的距离;One-Hot编码对包含离散型特征的回归模型及分类模型的效果有很好的提升。
数据预处理-特征编码与离散化最先出现在Python成神之路。
共有 0 条评论