对sklearn中transform()和fit_transform()的深入理解
在用机器学习解决问题时,往往要先对数据进行预处理。其中,z-score归一化和Min-Max归一化是最常用的两种预处理方式,可以通过sklearn.preprocessing模块导入StandardScaler()和 MinMaxScaler()接口实现,而在调用这两个接口时,有三种方法:fit(), fit_transform() , transform()。
但是,查阅了许多博客以及官方文档,都没有把这几个函数的区别讲清楚。
因此,今天花了半天时间,把这个问题探索清楚。
还是先提一下这两个归一化方法。
z-score归一化: x = (x - x的均值)/ x的方差
Min-Max归一化: x = (x - x的最小值) / (x的最大值 - x的最小值)
官方文档:
只有两行文字解释,说了等于没说,。。。= =
So, 下面通过实验来验证。为了让文章更简洁,这里只挑选了项目中的部分代码。
1、通过 fit_transform() 对训练集进行归一化,这里采用Min-Max归一化
版权声明:
作者:zhangchen
链接:https://www.techfm.club/p/28586.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
THE END
二维码
共有 0 条评论