此篇將介紹如何讀取Excel檔案,請先找到這個Step,[input]Microsoft Excel Input,然後就開始新增Step吧! 準備Excel檔案...
思考流程 資料科學的流程基本原則就是:「從資料開始,透過一連串的過程發現隱藏在資料中的規則,利用這些規則完成一些有趣的應用。」大致的流程會是: 取得資料 -&g...
條件機率 那我就先幫大家複習一下條件機率吧!條件機率是指在某些條件發生的前提之下,某件事發生的機率,其實人類觀察很多事物是用條件機率做判斷的,而非一般的機率。即...
終於,程式猿用了6天(Day6-Day11)砍就了30天見面會的第二個主題:R語言基礎!我們曾使用過R的內建資料集(iris)作練習,不過在實戰中,資料集則多半...
今天透過觀察範例檔案來了解如何執行Transformation,請開啟data-integration\samples\transformations\CSV...
延續上一篇,此篇將繼續介紹如何將拆解的日期重新合併,接下來的操作會比較繁瑣,但如果都能跟得上的話,就代表你對Kettle的操作熟練度又更上一層樓囉!此篇會介紹到...
黑色好看版 - 傳送門 本篇文章是用來補充一下,前面忘了講的觀念,記得在第一篇時,我們有提過下面這句話。 MongoDB 不支持事務操作 但事實上這段話有...
此篇要來介紹Email通知的功能,通常資料轉置是很龐大的,一跑可能就好幾個小時,我們當然也不會傻傻的在那邊等先跑去打混摸魚一下再說XD,所以最希望有自動通知的功...
此篇要介紹讀取資料來源最常用到的Step,當然就是[Input]Table input了,另外[Big Data]中也提供Hadoop與MongoDB的資料讀取...
本篇要介紹另外一種Join的Step:[Joins]Merge Join,Join的類型有四種可以選擇,而前一篇的Database Join就只有Left Jo...