python中Fearturetools三個(gè)基本概念
常規(guī)特征工程學(xué)方法通過(guò)人工構(gòu)造特征,是一個(gè)繁瑣、費(fèi)時(shí)且易出錯(cuò)的過(guò)程。自動(dòng)化特征工程是一個(gè)通過(guò)諸如Fearturetools之類的工具,從一組相關(guān)數(shù)據(jù)表中自動(dòng)產(chǎn)生有用特征的過(guò)程。與手工生成的特征相比,該方法效率更高,重復(fù)性更高,并能更快的建立模型。
一、Featuretools是什么?
Featuretools是一個(gè)用于執(zhí)行自動(dòng)化特征工程的開(kāi)源庫(kù)。
二、Featuretools基本的三個(gè)概念
1、FeaturePrimitives(特征基元):
生成特征的常用方法,分為聚合、轉(zhuǎn)換的方式。
特征加工方法
importfeaturetoolsasft
ft.list_primitives()
2、Entity(實(shí)體)
可以被看作類似PandasDataFrame,多個(gè)實(shí)體的集合稱為Entityset。
實(shí)體間可以根據(jù)關(guān)聯(lián)鍵添加關(guān)聯(lián)關(guān)系Relationship。
3、dfs(深度特征合成)
是從多個(gè)數(shù)據(jù)集創(chuàng)建新特征的過(guò)程,可以通過(guò)設(shè)置搜索的深度(max_depth)來(lái)控制所特征生成的復(fù)雜性。
以上就是python中Fearturetools三個(gè)基本概念,希望能對(duì)大家有所幫助。更多Python學(xué)習(xí)教程請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。