数据预处理-特征编码与离散化

特征编码
1、OneHotEncoder
sklearn.preprocessing.OneHotEncoder
preprocessing.OneHotEncoder( n_values=‘auto’, #‘auto’,int或int数组,每个特征的取值个数。 categorical_features=‘all’, #指定将哪些功能视为分类 dtype=, #期望的输出类型 sparse=True, #如果设置为True将返回稀疏矩阵,否则将返回一个数组。 handle_unknown=‘error’ #若转换期间存在未知的分类特征,引发错误还是忽略 )
将包含?个取值的离散型特征转换成?个二元特征(取值为0或1) 优点:经过One-Hot编码之后,不同的原始特征之间拥有相同的距离;One-Hot编码对包含离散型特征的回归模型及分类模型的效果有很好的提升。

数据预处理-特征编码与离散化最先出现在Python成神之路

版权声明:
作者:siwei
链接:https://www.techfm.club/p/23376.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>