在上篇我們有用到wine這個內鍵數據集,今天一樣要用它來帶大家挑出主要影響分類的屬性!我們開始著手吧~ 分類型數據集評估 在上篇有說到,這組數據為義大利同一地區...
在一個大數據中,屬性與數據這麼多的情況下,要如何挑出有用的特徵屬性,且將數據都映射於平面二維中呢?今天就要來跟大家說明如何使用昨天講述到的PCA來操作拉~ 繪圖...
溫沙拉 Salade Tiede 溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與...
進階試算表工作 Advance Excel Tasks 今天是香料系列的最後一篇文章,代表著我們組合 Python 的功能講的差不多了,今天終於來到久久沒有說到...
進階試算表工作 Advance Excel Tasks 上篇以 Excel 中的 Filter 函數為模型,說明各種 Pandas 索引方式,這篇文章中將重點介...
今天我們要來探索新插件!又是個實作日了,準備好,我們就開工啦~ 安裝並重新開啟 首先,我們至Orange上的工作列表點選「Options」,再來點選其中最下面的...
尋找與過濾 Filter and Edit 最近有朋友跟我說我前陣子寫的關於 Pandas 中常見的 Excel 文章,對於幫助新的 Pandas 用戶將 Ex...
今天又是科普日~偷偷預告大家一下,科普篇剩不多惹,如果你是喜歡被科普的人,得好好珍惜剩下的幾篇啦,但若你是不喜歡的,那我也恭喜你快撐過去啦,剩沒幾篇,接下來幾乎...
文件解析與數據清理 昨天介紹了多個Excel文件合併數據與清理數據的流程,Python 和 Pandas 的結合對於整個操作而言是非常強大,它的可擴展性和功能更...
香料 Spices 辛香料的搭配是我很愛的一種料理方法,利用非常天然簡單的香料,點綴著原先澀澀略腥的料理,他不經過多的加工,早期甚至應用於藥材,帶給他一層神秘的...
終於到了實作天,今天將會教導大家如何評估模型,準備好我們就開始囉~ 匯檔、建模型 這次我們將用回鳶尾花數據集來呈現,匯入File後,先用個簡單的分類方法訓練模型...
Vlookup 的好朋友 FuzzyWuzzy Vlookup 是我們很常使用的 Excel 功能,他幫我們達成快速匹配數值,當我們需要找到 A 所對應的 B...
經過了前兩天補充的小知識,今天我們就來用Orange做個預測看看唄! 匯入檔案&檢查 這次用到的數據是水果與蔬菜的訓練集,需要的人可以直接點擊超連結進入...
一些在 Python 簡單的,在 Excel 會很複雜的事情 結束上次提及的加權平均數,這次的目的是展示一些常見的 Excel 任務,以及你如何在 pandas...
更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...
今天要來跟大家說說如何判斷資料裡的種類,並且用階層式分群法發現不同的組及子組,這次一次一樣會用到鳶尾花的資料集來向大家展示喔!(它真的是太好用惹~ 觀察 在連接...
榫卯,如同拼圖一樣組合起結構 榫卯,是中國傳統木工中接合建築與結構的方式,利用榫頭插入另一個的卯眼中,使兩個構件連接並固定,與現代工藝不同的地方在於榫和卯眼之間...
為了因應明天會用到的組件,所以先來科普一下大家拉~ 階層式分群法(Hierarchical Clustering) 它是透過階層架構的方式,將資料一層層地反覆...
現有特徵 Feature 自今我們已經介紹了樞紐分析來進行分組與分類,相關性可視化降低對於數據解讀的難度,學會了許多應用數據的方法,此外我們還有一種選擇是放棄特...
在數據挖掘中,數據的好壞關乎到後續分析的過程,所以是很重要的一個部分,那今天我們就來學習自己建數據,並用Orange呈現與儲存看看拉~(♡˙︶˙♡) Googl...
經過了前五天的吸收,今天是個「小」顯身手的好時間,我們快快開始吧~ 數據來源與使用目的 這次用的數據,是從DATA STATION「2022數據合作實驗室數據競...
關聯性視覺化 Analyze by visualizing 資料視覺會是最常被使用的方法之一,除了樞紐分析快速幫助原始資料來進行分組與分類外,另外一種執行的方式...
工具的使用取決於你 How to use tools 工具的使用是數據分析師一大利器,生活中已經有非常多好用的工具了,但是選擇最適合當下情況的工作才能夠事半功倍...
如果用 Python 處理鐵達尼號的資料會是什麼樣子? 前幾篇文章的內容中我們已經利用 Excel 來處理鐵達尼號的資料集,試著判斷出不同的標頭資料,也進行了樣...
在上篇學會把一個個項目接起來後,今天會更詳細說明其中的功能,而這篇將繼續沿用上篇的鳶尾花樣本當作範例呦~ File - Data Table 連接完成後,我們可...
試算表的樞紐分析 Sheet of Pivoting Table 之前在完成介紹完工作流程階段與異常值糾正後,使用了 Python 進行樞紐分析(Pivotin...
這聽起來很酷,但是我該怎麼訓練解題過程 對於數據分析師我覺得最容易訓練解題過程的方式就是利用 Kaggle,我相信數據分析師對於 Kaggle 應該不會太陌生,...
Becoming a Data Scientist 剛剛其實有提到,解構問題並且從中找到 Insight 是分析師最重要的能力,所以在做分析時必須理解到你要分析...
前言 在我們進入正題之前,想詢問一下大家,你們用於資料分析的圖表是如何生成的呢?在想這個問題時,第一個從腦中跑出的畫面,大多是否為程式指令印出或Office內建...
這跟我聽到的不太一樣 『先別急著學 Python 』這個主題與大家的直觀理解會有蠻大的反差,但是以我作為一個資料分析師,對於想要進入數據入門的人的建議,是先把...