feature tools:Python 中的自动化特征工程

feature tools官网 https://www.featuretools.com/ 特征工程基础
特征工程意味着从现有数据中构建附加特征,这些数据通常分布在多个相关表中。特征工程需要从数据中提取相关信息并将其放入单个表中,然后可用于训练机器学习模型。
构建特征的过程非常耗时,因为每个新特征通常需要几个步骤来构建,尤其是在使用来自多个表的信息时。我们可以将特征创建的操作分为两类:转换和聚合。让我们看几个例子,看看这些概念的实际应用。
一个转化作用于单个表(思维在Python而言,表只是一个熊猫DataFrame通过创建新的功能出来的一个或多个现有列)。例如,如果我们有下面的客户表

我们可以通过查找joined列的月份或取列的自然对数来创建特征income。这些都是转换,因为它们只使用一张表中的信息。

另一方面,聚合是跨表执行的,并使用一对多关系对观察进行分组,然后计算统计量。例如,如果

feature tools:Python 中的自动化特征工程最先出现在Python成神之路

版权声明:
作者:主机优惠
链接:https://www.techfm.club/p/13446.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>