2019/10/15
這是一篇我的資料科學數據分析方面的經驗分享,不管是好的、壞的,或是成功的、失敗的經驗,希望對大家有所幫助。
在即將完成挑戰 AI & Data 技術文章鐵人賽,撰寫主題「打造 Microsoft BI 資料服務平台解決方案」連續 30 天的技術文章發佈,從資料科學數據分析的說明,資料服務平台的概念介紹開始展開,接連介紹了 Microsoft 的資料服務技術,Power BI 解決方案架構規劃,Microsoft 資料產品及服務的介紹,一直到資料服務平台的規劃與設計,資料平台建置的實際案例經驗分享,我們發覺技術文章的分享只是一個開端,30 篇的文章也只能侷限於篇幅數量內容,無法非常詳細的介紹軟體工具,架構技術,以及規劃設計細節,大致上文章的內容都偏向以概念性的介紹為主,接下來,有機會的話,我們會陸陸續續把更為細節的技術說明內容整理成一系列的相關文章來分享給大家。
這一篇經驗分享的文章,為什麼稱之為 Case Study,其實,應該說是我在資料科學的學習途徑之上的實際案例經驗分享,提供大家學習的一些路徑和管道,另外,在相關的工作經驗上,技術分享上,公司實務應用上,也都有一些小小的經驗提供給大家分享參考!
從兩年前的 AI 熱門開始,接觸了很多機器學習 (Machine Learning) 和 人工智慧神經網路架構 (Neural Network framework),學習了很多有關預測,分群分類,推薦服務,影像辨識等 AI 熱門的應用服務架構,但是因為穩定性,正確率,以及學習架構的驗證方法,和神經網路的學習結果無法預測,造成應用服務上的困難,漸漸地轉往資料整合及數據分析 BI 的領域。
在 BI 的數據服務架構上,各式各樣的整合軟體及分析工具,從非結構化資料處理儲存架構,到結構化 SQL 資料倉儲解決方案,從雲端服務到地端部署軟體工具或混合式的整合架構,選擇了 Microsoft 提供的企業級資料服務平台架構為主軸,學習各種數據整合服務的架構,才會有這幾篇技術文章的分享。
選擇 Microsoft 提供的軟體、服務及工具,這是因為微軟提供的企業級的資料服務平台解決方案,包括雲端、地端、混合方式的整合架構,彈性且延伸擴充容易,學習曲線較為簡單快速,上手方便且容易,可以讓企業組織在既有的環境之上架構資料服務數據分析應用平台,不論是人力上,成本上,架構上,應用上,整合上都可以容易的規劃及設計解決方案,是一個不錯的選擇。
經過這兩年的學習以及客戶的諮詢以及顧問規劃,我們了解到目前市場上遭遇到的問題與困境,我大致整理幾點我覺得比較重要的幾點來做說明:
資料整合服務目前應用的情境大概分為兩大類:BI 和 AI,AI 目前仍然如火如荼的進行中,不論是影像、語音、自然語言處理、推薦服務等,都是目前 AI 人工智慧領域積極發展的方向,也有越來越多的應用服務推陳出新,我們也一直期待有更多更好的人工智慧應用服務實際落實應用在現實生活環境之中。
BI 是目前比較確實可以實際應用的情境,透過日積月累的資料數據,使用資料分析的各項整合及工具,在資料數據中挖掘出商業智慧,歸納取得企業環境領域知識,不論是用來協助經營,輔助決策,或是即時監控,甚至推測預估等,都是非常實際可以應用在企業環境之中的服務。
PS : 不論是 AI 或是 BI 都是從「資料」來出發,資料服務平台是 AI 和 BI 的基礎,所以我們必須在資料的集成,處理,整理,歸納,統計,分析等作業上做好規劃與設計,才能為 AI 和 BI 搭建起所需要的資料整合服務平台。