tf.Tramsform
。preprocessing_fn()
自訂函式中,譬如某些特徵的資料型態轉換、資料清洗、標準化等,甚至可能複數特徵進行Bucketize、Feature Cross 等,把特徵工程的邏輯寫入,您也可以設想,現在的工作是在之後部署時面對「未知」資料流的資料工程手段。Training-Serving Skew
。
tft.apply_save_model
儲存模型。數值範圍的特徵工程
tft.scale_to_z_score
tft.scale_0_to_1
tft.scale_to_qaussian
群組化的特徵工程
tft.bucketize
tft.quantiles
tft.apply_buckets
詞彙型的特徵工程
tft.bag_of_words
tft.tfidf
tft.ngrams
tft.string_to_int
降維的特徵工程
tft.pca
特徵編碼的特徵工程
#0-N
pandas.factorize()
sklearn.preprocessing.LabalEncoder()
#One-Hot
tf.one_hot
pandas.get_dummies()
sklearn.preprocessing.OneHotEncoder()
組合特徵的特徵工程
tf.string_join
tft.string_to_int