iT邦幫忙

數據分析相關文章
共有 174 則文章
鐵人賽 AI & Data DAY 19

技術 〔Day19〕如何找出最佳屬性-Box Plot、Distribution

在上篇我們有用到wine這個內鍵數據集,今天一樣要用它來帶大家挑出主要影響分類的屬性!我們開始著手吧~ 分類型數據集評估 在上篇有說到,這組數據為義大利同一地區...

鐵人賽 AI & Data DAY 18

技術 〔Day18〕將數據化繁為簡-PCA

在一個大數據中,屬性與數據這麼多的情況下,要如何挑出有用的特徵屬性,且將數據都映射於平面二維中呢?今天就要來跟大家說明如何使用昨天講述到的PCA來操作拉~ 繪圖...

鐵人賽 AI & Data DAY 18

技術 Ɖ18-溫沙拉/ 簡單樞紐分析與快速分析式輸出

溫沙拉 Salade Tiede 溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與...

鐵人賽 AI & Data DAY 17

技術 Ɖ17-香料/ Excel 的進階尋找過濾

進階試算表工作 Advance Excel Tasks 今天是香料系列的最後一篇文章,代表著我們組合 Python 的功能講的差不多了,今天終於來到久久沒有說到...

鐵人賽 AI & Data DAY 16

技術 Ɖ16-香料/ 進階尋找與過濾

進階試算表工作 Advance Excel Tasks 上篇以 Excel 中的 Filter 函數為模型,說明各種 Pandas 索引方式,這篇文章中將重點介...

鐵人賽 AI & Data DAY 16

技術 〔Day16〕探索新插件-Bioinformatics

今天我們要來探索新插件!又是個實作日了,準備好,我們就開工啦~ 安裝並重新開啟 首先,我們至Orange上的工作列表點選「Options」,再來點選其中最下面的...

鐵人賽 AI & Data DAY 15

技術 Ɖ15-香料/ 快速尋找與過濾

尋找與過濾 Filter and Edit 最近有朋友跟我說我前陣子寫的關於 Pandas 中常見的 Excel 文章,對於幫助新的 Pandas 用戶將 Ex...

鐵人賽 AI & Data DAY 15

技術 〔Day15〕數據也可以降維?-MDS

今天又是科普日~偷偷預告大家一下,科普篇剩不多惹,如果你是喜歡被科普的人,得好好珍惜剩下的幾篇啦,但若你是不喜歡的,那我也恭喜你快撐過去啦,剩沒幾篇,接下來幾乎...

鐵人賽 AI & Data DAY 14

技術 Ɖ14-香料/ pd.merge 資料檔案合併分類計算

文件解析與數據清理 昨天介紹了多個Excel文件合併數據與清理數據的流程,Python 和 Pandas 的結合對於整個操作而言是非常強大,它的可擴展性和功能更...

鐵人賽 AI & Data DAY 13

技術 Ɖ13-香料/ 大量 Excel 資料檔案合併

香料 Spices 辛香料的搭配是我很愛的一種料理方法,利用非常天然簡單的香料,點綴著原先澀澀略腥的料理,他不經過多的加工,早期甚至應用於藥材,帶給他一層神秘的...

鐵人賽 AI & Data DAY 14

技術 〔Day14〕機器學習的模型評估-Logistic Regression、Random Forest、Tree

終於到了實作天,今天將會教導大家如何評估模型,準備好我們就開始囉~ 匯檔、建模型 這次我們將用回鳶尾花數據集來呈現,匯入File後,先用個簡單的分類方法訓練模型...

鐵人賽 AI & Data DAY 12

技術 Ɖ12-榫卯/ 利用 Python 完成 Vlookup !超級好用的 FuzzyWuzzy

Vlookup 的好朋友 FuzzyWuzzy Vlookup 是我們很常使用的 Excel 功能,他幫我們達成快速匹配數值,當我們需要找到 A 所對應的 B...

鐵人賽 AI & Data DAY 12

技術 〔Day12〕來做個小預測吧-Tree、Logistic Regression

經過了前兩天補充的小知識,今天我們就來用Orange做個預測看看唄! 匯入檔案&檢查 這次用到的數據是水果與蔬菜的訓練集,需要的人可以直接點擊超連結進入...

鐵人賽 AI & Data DAY 11

技術 Ɖ11-榫卯/ 一些在 Python 簡單的,在 Excel 會很複雜的事情

一些在 Python 簡單的,在 Excel 會很複雜的事情 結束上次提及的加權平均數,這次的目的是展示一些常見的 Excel 任務,以及你如何在 pandas...

鐵人賽 AI & Data DAY 10

技術 Ɖ10-榫卯/ 利用分組 Python 方式計算加權平均數

更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...

鐵人賽 AI & Data DAY 9

技術 〔Day9〕數據分層並可視化-Hierarchical Clustering、Scatter Plot

今天要來跟大家說說如何判斷資料裡的種類,並且用階層式分群法發現不同的組及子組,這次一次一樣會用到鳶尾花的資料集來向大家展示喔!(它真的是太好用惹~ 觀察 在連接...

鐵人賽 AI & Data DAY 9

技術 Ɖ9-榫卯/ 利用多種 Python 方式簡單計算加權平均數

榫卯,如同拼圖一樣組合起結構 榫卯,是中國傳統木工中接合建築與結構的方式,利用榫頭插入另一個的卯眼中,使兩個構件連接並固定,與現代工藝不同的地方在於榫和卯眼之間...

鐵人賽 AI & Data DAY 8

技術 〔Day8〕淺談階層式分群法(Hierarchical Clustering)

為了因應明天會用到的組件,所以先來科普一下大家拉~ 階層式分群法(Hierarchical Clustering) 它是透過階層架構的方式,將資料一層層地反覆...

鐵人賽 AI & Data DAY 8

技術 Ɖ8-根/ 鐵達尼號的 Python 自訂特徵與異常值處理

現有特徵 Feature 自今我們已經介紹了樞紐分析來進行分組與分類,相關性可視化降低對於數據解讀的難度,學會了許多應用數據的方法,此外我們還有一種選擇是放棄特...

鐵人賽 AI & Data DAY 7

技術 〔Day7〕自己動手建數據!

在數據挖掘中,數據的好壞關乎到後續分析的過程,所以是很重要的一個部分,那今天我們就來學習自己建數據,並用Orange呈現與儲存看看拉~(♡˙︶˙♡) Googl...

鐵人賽 AI & Data DAY 6

技術 〔Day6〕練習小實作-Scatter Plot

經過了前五天的吸收,今天是個「小」顯身手的好時間,我們快快開始吧~ 數據來源與使用目的 這次用的數據,是從DATA STATION「2022數據合作實驗室數據競...

鐵人賽 AI & Data DAY 7

技術 Ɖ7-根/ 鐵達尼號的 Python 的資料關聯性視覺化

關聯性視覺化 Analyze by visualizing 資料視覺會是最常被使用的方法之一,除了樞紐分析快速幫助原始資料來進行分組與分類外,另外一種執行的方式...

鐵人賽 AI & Data DAY 6

技術 Ɖ6-根/ 鐵達尼號的 Python 的樞紐分析應用

工具的使用取決於你 How to use tools 工具的使用是數據分析師一大利器,生活中已經有非常多好用的工具了,但是選擇最適合當下情況的工作才能夠事半功倍...

鐵人賽 AI & Data DAY 5

技術 Ɖ5-根/ 鐵達尼號的 Python 的資料型態應用

如果用 Python 處理鐵達尼號的資料會是什麼樣子? 前幾篇文章的內容中我們已經利用 Excel 來處理鐵達尼號的資料集,試著判斷出不同的標頭資料,也進行了樣...

鐵人賽 AI & Data DAY 5

技術 〔Day5〕組件間的關係與應用-File、Data Table、Scatter Plot

在上篇學會把一個個項目接起來後,今天會更詳細說明其中的功能,而這篇將繼續沿用上篇的鳶尾花樣本當作範例呦~ File - Data Table 連接完成後,我們可...

鐵人賽 AI & Data DAY 4

技術 Ɖ4-根/ 鐵達尼號的 Excel 樞紐分析表

試算表的樞紐分析 Sheet of Pivoting Table 之前在完成介紹完工作流程階段與異常值糾正後,使用了 Python 進行樞紐分析(Pivotin...

鐵人賽 AI & Data DAY 3

技術 Ɖ3-根/ 鐵達尼號的 Excel 特徵分類與異常值偵測

這聽起來很酷,但是我該怎麼訓練解題過程 對於數據分析師我覺得最容易訓練解題過程的方式就是利用 Kaggle,我相信數據分析師對於 Kaggle 應該不會太陌生,...

鐵人賽 AI & Data DAY 2

技術 Ɖ2-根/ 推論計算台北市一共有幾隻鳥

Becoming a Data Scientist 剛剛其實有提到,解構問題並且從中找到 Insight 是分析師最重要的能力,所以在做分析時必須理解到你要分析...

鐵人賽 AI & Data DAY 2

技術 〔Day2〕零程式也可以資料分析?-Orange初步認識

前言 在我們進入正題之前,想詢問一下大家,你們用於資料分析的圖表是如何生成的呢?在想這個問題時,第一個從腦中跑出的畫面,大多是否為程式指令印出或Office內建...

鐵人賽 AI & Data DAY 1

技術 Ɖ1-序/ 先別急著學 Python

這跟我聽到的不太一樣 『先別急著學 Python 』這個主題與大家的直觀理解會有蠻大的反差,但是以我作為一個資料分析師,對於想要進入數據入門的人的建議,是先把...