技術問答
技術文章
iT 徵才
Tag
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
第 12 屆 iThome 鐵人賽
DAY
22
1
IoT
手拉手教自己用樹梅派、GoogleHome、GCP做一個AI智慧提醒機器人!
系列 第
22
篇
Day22 Dataprep
12th鐵人賽
A Li
2020-10-07 13:01:34
1113 瀏覽
分享至
Dataprep本身是google GCP與Trifacta提供的服務,著重於資料
Visually Exploring
Cleaning
Preparing structured and unstructured data for analysis, reporting, and machine learning.
首先進GCP搜尋Dataprep,
右上有提供主要的兩個服務
import data : 負責導入資料
create flow : 讓你設計資料的處理與流程
第一步import data 提供三種方式
upload : 本地上傳。
GCS : 可以使用firebase storage內的檔案。
Big Query : 可以使用big query內的檔案。
下一步使用creat flow
點擊右側,使用library 加入你已import的data
產生data後,點擊他右側的+號:
add new recipe : 資料處理。
add join : 進行不同欄位合併。
add union : 進行同欄位資料增加。
進行 edit recipe
會出現key與另一欄位,key會記錄專案名稱及路徑而另一欄位為document資訊,點擊後進行unnest及名稱修改即可產生如下圖:
之後依您需求進行join及union,之後進recipe右上即可執行run job,點擊action可改變產生得檔案
這邊我選擇進行產生json,再進行run job即可。
留言
追蹤
檢舉
上一篇
Day21 導出firebase資料(using dataflow)
下一篇
Day23 sql查詢指令
系列文
手拉手教自己用樹梅派、GoogleHome、GCP做一個AI智慧提醒機器人!
共
30
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
26
Day 26 我們來寫個網頁吧(Angular)
27
Day27 firbase hosting
28
Day28 firebase authentication
29
Day29 利用web發送訊息(上)
30
Day30 利用web發送訊息(下)
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19838
篇
完賽人數
529
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
源碼檢測稽核會不會超耗時
內控內稽的作業流程圖.請問哪裡有設備工程業的
你們都在哪裡購買SSL
WIN SERVER 出現錯誤LOG
VMware上的虛擬機多了一個VMDK的硬碟在增長
越南 Oracle EBS 輔導顧問公司
DOCKER問題請教
浮水印在PDF上沒有辦法顯示
熱門回答
你們都在哪裡購買SSL
源碼檢測稽核會不會超耗時
內控內稽的作業流程圖.請問哪裡有設備工程業的
WIN SERVER 出現錯誤LOG
VMware上的虛擬機多了一個VMDK的硬碟在增長
熱門文章
Google 暗網監控 暗網報告
資料視覺化工具比較全攻略:選出最懂你的可視化平台
別找了!最全資料視覺化配色指南在這
掌握財務命脈:揭祕16個常用的財務指標
20個時間序列基本概念,學會幫你做好預測分析!
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}