iT邦幫忙

data science相關文章
共有 238 則文章
鐵人賽 AI & Data DAY 4

技術 [Day 4] 資料產品第二層 - 資料加工術 - 資料驗證與清洗

稻米就算採收,也無法直接食用,需要經過一系列的加工才能送到消費者的手裡。 (圖片來源:富里鄉農會) 這個流程跟加工資料的流程並沒有什麼太大的差異,常見的資料基...

鐵人賽 AI & Data DAY 3

技術 [Day 3] 資料產品第一層 - 原始資料的類型

原始資料可能來自非常多不同的地方,我們可以根據資料產生的方式來加以分類 感應器資料 這邊泛指各種 Sensor 測量得到的資料。Sensor 是普遍用來將資訊資...

鐵人賽 AI & Data DAY 2

技術 3面向談ML產品與軟體產品的相異處

在過去的5-7年當中,ML已經不再只限於研究人員能夠接觸、使用,越來越多的AI/ML工具以及產品出現,使得能夠談論這個領域的人變多了,踏入ML工作的門檻也逐漸降...

鐵人賽 AI & Data DAY 2

技術 [Day 2] 資料產品第一層 - 原始資料

就像稻米之於米苔目,小麥之於麵疙瘩,原始資料就是任何資料產品最基礎的存在。 在研究所修讀統計的時候,教授常常掛在嘴邊的一句話就是「garbage in, ga...

鐵人賽 AI & Data DAY 1

技術 [Day 1] 資料產品簡介

前言 大數據、AI 是這幾年的熱門議題,不管是公司還是客戶都會開始透過資料分析或機器學習來改善自家產品或業務。但是這幾年走下來不管是自己公司還是客戶,在這個資料...

鐵人賽 AI & Data DAY 1

技術 學習MLOps前暖身操:why, what, who?

接下來的30天,我們會一起看MLOps的更多層面。從為什麼產業開始談MLOps開始,以及其包含的技術與非技術面。今天我想談的是關於學習mlops前必備的3個背景...

技術 我們的基因體時代-AI, Data和生物資訊 Overview

大家好,我們的基因體時代是我之前一直在經營的部落格名稱,假如對於生物資訊、合成生物學、基因體學、資料視覺化、R有興趣的話,可以來參觀參觀,也歡迎同好多多交流,這...

技術 資料科學、資料探勘、機器學習、深度學習是甚麼碗糕?

初次接觸AI時,常常會聽到數據分析、資料科學、機器學習、深度學習,一堆專有名詞,倒底是甚麼碗糕? 有何差別? 可以吞得下去嗎? 會不會消化不良? 資料科學(Da...

技術 AutoML應用分享║DataRobot 年度線上大會 2021

一年一次關注全球AI實踐家怎麼想 不知道大家習不習慣註冊業界大廠辦的活動?撇除我們自己是DataRobot台灣代理商而協助推廣外真心覺得是一個可以偶爾打開格局眼...

技術 [Matplotlib] - Introduction to Charts and Plots

ax.subplots() bar Plotting time-series Quantitative comparisons and statistics v...

鐵人賽 AI & Data DAY 22
人機結合 數據與學習 系列 第 22

技術 程式語言的世界

人的科技文明發展始終來自於人性 在人工智慧成為一個顯學的現今,除了要學習許許多多相關的知識之外,還要學會如何寫程式,在人工智慧與大數據分析這兩個結合在一起的領域...

鐵人賽 AI & Data DAY 21
人機結合 數據與學習 系列 第 21

技術 資料庫

人的科技文明發展始終來自於人性 在大數據的世界裡,"資料庫"是一個非常重要的心臟,也是所有一切的根本,而所有的資訊與應用也都建立在資料庫上,...

鐵人賽 AI & Data DAY 20

技術 Neo4j Data Science 資料分析與 Bloom 視覺化

前面一系列文章已經介紹過 Neo4j Bloom 以及 Neo4j GDS,Bloom 的強處是視覺化,GDS 的強處是演算法,現在該是時候把兩者結合了!畢竟光...

鐵人賽 AI & Data DAY 19

技術 Neo4j Data Science - 演算法實作資料分析

在上一篇文章介紹了在 Neo4j 做資料分析前的準備動作,評估記憶體用量和建立子圖,今天我們就來嘗試其中兩個演算法,中心位置演算法的 Page Rank 和群聚...

鐵人賽 AI & Data DAY 18

技術 Neo4j Data Science - 評估記憶體與建立子圖

在前面的文章中,有介紹過 Neo4j Bloom,不過在產品定位上,它仍比較是一個視覺化的資料互動工具,如果我們需要跑一些特殊的演算法,例如要尋找一個圖的中心點...

技術 大數據:到2020年您應該知道的70個令人難以置信的免費數據源

所有出色的數據可視化都始於需要大量優質可靠的數據。大多數人認為收集大數據將是一項艱鉅的工作,但事實並非如此。在線網站上有數千個免費數據集,任何人都可以隨時對其進...

技術 Why learn Python for Data Science?

Data Science is a multi-disciplinary field where one uses algorithms, processes,...

技術 免費票║AI Experience Worldwide兩日線上全球大會

分享免費線上活動 由DataRobot舉辦,內容與AutoML 與 Advanced Analytics相關 光看邀請到的Keynote Speaker,覺得跟...

技術 如何通过Web数据提取来Google购物价格

Google购物是营销您的在线业务并增加销售额的良好起点。但是,如果您是新手,则必须使用网络数据提取工具(网络抓取工具)来观看和了解竞争对手如何在Google购...

鐵人賽 AI & Data DAY 30

技術 [Day 30] 更多關於資料科學、與資料視覺化

來到了這個系列的最後一篇,除了這個主題之外還會有我個人的一些心得~ 關於資料科學 這其實是一門博大精深的學問,整個過程會包含像是定義問題、確認需要哪些資料、搜...

鐵人賽 AI & Data DAY 29

技術 [Day 29] 圖表以外的資料視覺化方法

也慢慢進入到這整個系列的尾聲了,其實這整個系列,我們在談的都是透過靜態圖表這種呈現方式的視覺化。 但其實還有其他方式也可以達成視覺化的目的,例如資訊圖表、影片、...

鐵人賽 AI & Data DAY 28

技術 [Day 28] 資料視覺化的工具

在前面幾篇看完一些資料視覺化可能會犯的錯、以及介紹了一些突顯重點的小技巧之外,這篇讓我們來快速看看有哪些工具可以來幫助你進行資料視覺化吧。 程式語言類 這應該...

鐵人賽 AI & Data DAY 27

技術 [Day 27] 凸顯圖表重點的小技巧2

在上一篇介紹了一些比較好操作的凸顯圖表重點的小技巧,例如藉由圖表的顏色、或是標題的文字,來讓觀眾一眼就能夠看出你想要表達的重點。 接下來我們再繼續來看看一些其他...

鐵人賽 AI & Data DAY 26

技術 [Day 26] 凸顯圖表重點的小技巧1

在上一篇看到了在製作資料視覺化圖表時,有哪些容易踩的雷、以及如何避免之後,接下來讓我麼來看看更多可以幫你凸顯資料重點的小技巧吧。 畢竟,圖表通常只是輔助,真正有...

鐵人賽 AI & Data DAY 25

技術 [Day 25] 視覺化圖表的 Dos & Don'ts 2

在上一篇 [Day 24] 視覺化圖表的 Dos & Don'ts 1 我們介紹了在製作視覺化圖表時的幾個常出現的錯誤,今天我們再來繼續看看還有哪些錯誤...

鐵人賽 AI & Data DAY 24

技術 [Day 24] 視覺化圖表的 Dos & Don'ts 1

前面我們看過了有哪些可以挑選更適合的圖表方法,做出更棒的圖表之後,今天我們換個角度來看看再進行圖表的設計與選擇時,有哪些錯誤是應該要避免掉的。 避免使用立體圖...

鐵人賽 AI & Data DAY 23

技術 [Day 23] 呈現多種特性的資料2 - 再來思考如何呈現

在前一篇 [Day22] 呈現多種特性的資料1 有提到要先找出用這些資料想要呈現出的重點,接下來就來實際看看一些案例吧。 坐於言不如起而行 都先確認好資料的樣...

鐵人賽 AI & Data DAY 22

技術 [Day 22] 呈現多種特性的資料1 - 先找出重點

好了,經過前面的介紹,現在應該對於如何幫資料找到適合的方式之後,我們現在來更進一步,找看看是否有「更」適合的方式。尤其是當資料很複雜、有多個不同面向可以切入去做...

鐵人賽 AI & Data DAY 21

技術 [Day 21] 好還要更好:資料視覺化的小技巧與工具

終於也慢慢接近這 30 天挑戰的尾聲了,在前面的幾個主題中,主要都在介紹資料視覺化的圖表們,其中又大致分為以下四個大類別。 [Day 4] 用來呈現時間趨勢...

鐵人賽 AI & Data DAY 20

技術 [Day 20] 無法分類的其他圖表們2

前一篇也介紹了一些在專案管理的情境中,還蠻常會遇到的圖表們,這篇就讓我們來看看最後還有剩下哪些圖表示之前漏掉沒介紹到的吧。 沖積圖/桑基圖 (Alluvial...