iT邦幫忙

kaggle相關文章
共有 41 則文章
鐵人賽 AI & Data DAY 26

技術 Day26 建立 Pyorch 的自訂資料集和 DataLoader

今天介紹的內容與 Day11、Day12 很像,我們需要建立資料集還有 DataLoader,首先我們先引入需要用到的套件,並且定義資料處理的流程: from...

鐵人賽 AI & Data DAY 23

技術 Day23 卷積神經網路實戰 - Fashion Product Images Dataset

https://www.kaggle.com/datasets/paramaggarwal/fashion-product-images-dataset 資料...

鐵人賽 自我挑戰組 DAY 6

技術 Day 6|實戰讀取並觀察外部資料

  在進行數據分析前,需要先了解資料的內容,以利後續資料清理、特徵工程等處理,因此本篇將延續昨日主題,以實際案例實作一次讀取外部資料,並使用基本語法觀察資料內容...

鐵人賽 AI & Data DAY 10

技術 Day 10 關於貓咪和兔子傻傻分不清那件事

接下來要進入實戰演練的部分,於是我就問了女友想要玩玩看什麼樣的資料, 女友:有沒有一種模型可以辨別出小圖(我們兔子的名字) 我:痾… 好像難度有點高,不然...

鐵人賽 AI & Data DAY 30

技術 Ɖ30-結語/ 先別急著停下腳步

先別急著停下腳步 清華大學的彭明輝老師在他的碩士新生手冊中,有寫到這句讓人感到玩味的話「什麼時候需要讀完弄懂一篇論文所有的恆等式推導過程? NEVER 你只需要...

鐵人賽 AI & Data DAY 29

技術 Ɖ29-布朗尼/ Pandas 的缺失值處理與應用

處理缺失數據 真實的數據很少是乾淨的。更常見的情況是,很多有意思的數據集都有很多的數據缺失。更複雜的是,不同的數據源可能有著不同指代缺失數據的方式,我們會將這些...

鐵人賽 AI & Data DAY 28

技術 Ɖ28-布朗尼/ Pandas 的索引探討與應用

索引過程 我們介紹過DataFrame表現得既像二維數組又像由共同的索引值組成的Series對象的字典。這能幫助你學習如何在DataFrame裡面進行數據選擇。...

鐵人賽 AI & Data DAY 27

技術 Ɖ27-布朗尼/ Pandas 的數據結構 Series 與 Datafram

從 Numpy 到 Pandas 的過程 NumPy 的數據結構為數據分析不可少的功能,雖然 ndarray 的功能已經很強大,但是當我們需要更多的靈活性的時候...

鐵人賽 AI & Data DAY 26

技術 Ɖ26-布朗尼/ Numpy 常見四大類型介紹

從實作回到理論 你知道,在過去25天中,我們從最初的 Kaggle 進行資料 Insign 尋找,我們解析了各式不同的資料類型,並且找到合適的方法將他做分析。後...

鐵人賽 AI & Data DAY 25

技術 Ɖ25-布朗尼/ Numpy 多維陣列呈現

布朗尼 Chocolate brownie 邁入倒數的五天了,轉眼間發現30天的挑戰賽其實過得非常快,許多內容皆在轉眼間。而最後一篇章節我所要講的主題稱為布朗尼...

鐵人賽 AI & Data DAY 24

技術 Ɖ24-溫沙拉/ 自定義欄目大小與內容

在溫沙拉結束後 After the Salade Tiede 還記得前幾天我們提到"Salade Tiede"的意思,溫沙拉的本質並未從沙拉做改變,而是在既有的...

鐵人賽 AI & Data DAY 23

技術 Ɖ23-溫沙拉/ 簡單 Pandas 匯出報表至 Excel

成功打印出樞紐分析表後 Pivot Table Print 提及了如何利用 get_level_values 來使工作自動化,我們也利用了 xs 函數來進階了解...

鐵人賽 AI & Data DAY 22

技術 Ɖ22-溫沙拉/ 進階樞紐匯出報表

樞紐匯出表 Reports from Pivot Table 上一篇關於數據透視表的文章描述瞭如何使用 pandas 的 pivot_table 功能將數據以一...

鐵人賽 AI & Data DAY 21

技術 Ɖ21-溫沙拉/ 進階樞紐分析呈現與過濾式

進階樞紐分析表 Pivot table 延續上一篇的 pandas pivot_table 函數以及數據分析與思考基本問題。 2021 - juck3080...

鐵人賽 AI & Data DAY 20

技術 Ɖ20-溫沙拉/ 進階樞紐分析表

進階樞紐分析表 Pivot table 回歸昨天提到的,大多數人可能都有在Excel中使用透視表的經驗。 Pandas 提供了一個類似的函數,叫做 Pivot_...

鐵人賽 AI & Data DAY 19

技術 Ɖ19-溫沙拉/ Excel 試算表上的簡單樞紐分析

樞紐分析表 Pivot table 樞紐分析表(Pivot Table)又被稱為資料透視表,是用來匯總不同列表的數據,把表進行分組(Grouping)並且對各個...

鐵人賽 AI & Data DAY 18

技術 Ɖ18-溫沙拉/ 簡單樞紐分析與快速分析式輸出

溫沙拉 Salade Tiede 溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與...

鐵人賽 AI & Data DAY 17

技術 Ɖ17-香料/ Excel 的進階尋找過濾

進階試算表工作 Advance Excel Tasks 今天是香料系列的最後一篇文章,代表著我們組合 Python 的功能講的差不多了,今天終於來到久久沒有說到...

鐵人賽 AI & Data DAY 16

技術 Ɖ16-香料/ 進階尋找與過濾

進階試算表工作 Advance Excel Tasks 上篇以 Excel 中的 Filter 函數為模型,說明各種 Pandas 索引方式,這篇文章中將重點介...

鐵人賽 AI & Data DAY 15

技術 Ɖ15-香料/ 快速尋找與過濾

尋找與過濾 Filter and Edit 最近有朋友跟我說我前陣子寫的關於 Pandas 中常見的 Excel 文章,對於幫助新的 Pandas 用戶將 Ex...

鐵人賽 AI & Data DAY 14

技術 Ɖ14-香料/ pd.merge 資料檔案合併分類計算

文件解析與數據清理 昨天介紹了多個Excel文件合併數據與清理數據的流程,Python 和 Pandas 的結合對於整個操作而言是非常強大,它的可擴展性和功能更...

鐵人賽 AI & Data DAY 13

技術 Ɖ13-香料/ 大量 Excel 資料檔案合併

香料 Spices 辛香料的搭配是我很愛的一種料理方法,利用非常天然簡單的香料,點綴著原先澀澀略腥的料理,他不經過多的加工,早期甚至應用於藥材,帶給他一層神秘的...

鐵人賽 AI & Data DAY 12

技術 Ɖ12-榫卯/ 利用 Python 完成 Vlookup !超級好用的 FuzzyWuzzy

Vlookup 的好朋友 FuzzyWuzzy Vlookup 是我們很常使用的 Excel 功能,他幫我們達成快速匹配數值,當我們需要找到 A 所對應的 B...

鐵人賽 AI & Data DAY 11

技術 Ɖ11-榫卯/ 一些在 Python 簡單的,在 Excel 會很複雜的事情

一些在 Python 簡單的,在 Excel 會很複雜的事情 結束上次提及的加權平均數,這次的目的是展示一些常見的 Excel 任務,以及你如何在 pandas...

鐵人賽 AI & Data DAY 10

技術 Ɖ10-榫卯/ 利用分組 Python 方式計算加權平均數

更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...

鐵人賽 AI & Data DAY 9

技術 Ɖ9-榫卯/ 利用多種 Python 方式簡單計算加權平均數

榫卯,如同拼圖一樣組合起結構 榫卯,是中國傳統木工中接合建築與結構的方式,利用榫頭插入另一個的卯眼中,使兩個構件連接並固定,與現代工藝不同的地方在於榫和卯眼之間...

鐵人賽 AI & Data DAY 2

技術 [Day 02] 在表情資料尋找邂逅是否搞錯了甚麼 (Facial Expression Recognition)

表情資料集的介紹與下載 俗話說:「知己知彼,百戰百勝」,這句話同樣也適合用在資料科學上,我們必須對資料的背景非常熟悉,才能夠設計出適合的演算法。今天,讓我介紹這...

鐵人賽 AI & Data DAY 1

技術 [Day00] 這次可以跟上 Kaggle 30 Days 挑戰了吧

前言 寫在前面Kaggle 不知道從何時開始,每年會有一段時間舉辦 30 days challenge(應該是2018年,然後是為了推進大家使用 Kaggle,...

技術 深度學習常用程式碼

之前沒整理程式碼的習慣經常想到某些程式碼就要翻以前寫的覺得有點浪費時間 之後有用到就貼上來 慢慢更新然後我會打一些關鍵字方便自己用Ctrl + F 搜尋 #ka...

鐵人賽 AI & Data DAY 14

技術 [Day 14] 以 Springleaf competition 實作 EDA

步驟 step 0 kaggle 網站找一個預測(結果是0或1)競賽 step 1 import libraries step 2 load the data...