累計文章數 17,823篇
參賽組數 926組
團隊組數 050隊
完賽人數 527 人
-----讓我們一起認識大數據Big Data吧! 今天的內容介紹是接續上篇一同探討的4V,今天要再來多介紹...
今天要來作第七張,跟做第八張報表前的小觀念,因為第七張報表實在是太簡單了先來看第七張,有哪一些欄位只有一個,就是所有有用過這個網站的業務的累計人數,累計代表同個...
前言 我們已經成功建立了一個深層網絡(Deeplearning Model),但是這些預測的結果是垃圾或者並不符合我們期待怎麼半QQQQQ。 我們又該將如何解...
這裡我用 pandas.DataFrame 裡的 groupby 幫我做分類然後用 apply(list) 把所有列的結果輸出就可以得到論文中一開始所說的「等價...
經過初步實驗結果,可以發現Model的執行時間相對其他的索引結構慢,也沒辦法很精準地預測結果... 那幹嘛用 Model....XD 開玩笑的...人家是大神,...
講完 Data Catalog 與 ETL Job 後,在整個資料處理的流程中可能會需要用自動化的方式讓整個流程可以夠便利,而今天就要來介紹如何創建 Glue...