feature tools:Python 中的自动化特征工程
feature tools官网 https://www.featuretools.com/ 特征工程基础
特征工程意味着从现有数据中构建附加特征,这些数据通常分布在多个相关表中。特征工程需要从数据中提取相关信息并将其放入单个表中,然后可用于训练机器学习模型。
构建特征的过程非常耗时,因为每个新特征通常需要几个步骤来构建,尤其是在使用来自多个表的信息时。我们可以将特征创建的操作分为两类:转换和聚合。让我们看几个例子,看看这些概念的实际应用。
一个转化作用于单个表(思维在Python而言,表只是一个熊猫DataFrame通过创建新的功能出来的一个或多个现有列)。例如,如果我们有下面的客户表
我们可以通过查找joined列的月份或取列的自然对数来创建特征income。这些都是转换,因为它们只使用一张表中的信息。
另一方面,聚合是跨表执行的,并使用一对多关系对观察进行分组,然后计算统计量。例如,如果
共有 0 条评论