iT邦幫忙

kaggle相關文章
共有 41 則文章
鐵人賽 AI & Data DAY 6

技術 [Day 6] bag of words / BOW 詞袋

從文字或影像提取特徵 Feature extraction from texts, images純 Text 競賽: Allen AI challenge純 I...

鐵人賽 AI & Data DAY 2

技術 [Day 02] 在表情資料尋找邂逅是否搞錯了甚麼 (Facial Expression Recognition)

表情資料集的介紹與下載 俗話說:「知己知彼,百戰百勝」,這句話同樣也適合用在資料科學上,我們必須對資料的背景非常熟悉,才能夠設計出適合的演算法。今天,讓我介紹這...

鐵人賽 AI & Data DAY 2

技術 [Day 2] kaggle網站重點/ 規劃 pipeline

kaggle網站重點 Data : 資料的區塊有兩個重點, description 跟 rules 要研讀清楚, 尤其是 rulesModel : 建模要發揮最...

鐵人賽 AI & Data DAY 13

技術 Ɖ13-香料/ 大量 Excel 資料檔案合併

香料 Spices 辛香料的搭配是我很愛的一種料理方法,利用非常天然簡單的香料,點綴著原先澀澀略腥的料理,他不經過多的加工,早期甚至應用於藥材,帶給他一層神秘的...

技術 深度學習常用程式碼

之前沒整理程式碼的習慣經常想到某些程式碼就要翻以前寫的覺得有點浪費時間 之後有用到就貼上來 慢慢更新然後我會打一些關鍵字方便自己用Ctrl + F 搜尋 #ka...

鐵人賽 AI & Data DAY 11

技術 Ɖ11-榫卯/ 一些在 Python 簡單的,在 Excel 會很複雜的事情

一些在 Python 簡單的,在 Excel 會很複雜的事情 結束上次提及的加權平均數,這次的目的是展示一些常見的 Excel 任務,以及你如何在 pandas...

鐵人賽 AI & Data DAY 7

技術 [Day 7] Word2vec, CNN

week 1 是 亞歷珊卓主講, 看了一個禮拜, 一次又一次反覆的看著, 聽者俄式英文加上不僅神似 NPH (Neil Patrick Harris in ho...

鐵人賽 AI & Data DAY 1

技術 [Day 1] 跟top kaggler學習如何贏得資料分析競賽 - 4周主題架構

為什麼選這個主題? 學習來源是 coursera 的一群年輕人在前 top 1 kaggler Alexander Djakonov 教導 ML 跟 kaggl...

鐵人賽 AI & Data DAY 9

技術 Ɖ9-榫卯/ 利用多種 Python 方式簡單計算加權平均數

榫卯,如同拼圖一樣組合起結構 榫卯,是中國傳統木工中接合建築與結構的方式,利用榫頭插入另一個的卯眼中,使兩個構件連接並固定,與現代工藝不同的地方在於榫和卯眼之間...

鐵人賽 AI & Data DAY 8

技術 [Day 8] EDA / Exploratory Data Analysis

第一週曾有說過天下沒白吃的午餐, 預處理後的重點仍是瞭解資料, EDA 幫助我們找出資料 insight , 理出真正的問題, 才能有對的, 好的解決方法, 不...

鐵人賽 AI & Data DAY 10

技術 [Day 10] Visualizations / 視覺化

先說點時事, 今天凌晨有 iPhone 11 發表會, 為了 AI 有新增一個 Core ML 庫可讓開發者調用. 回到 kaggle 比賽的準備. EDA 是...

鐵人賽 AI & Data DAY 23

技術 Ɖ23-溫沙拉/ 簡單 Pandas 匯出報表至 Excel

成功打印出樞紐分析表後 Pivot Table Print 提及了如何利用 get_level_values 來使工作自動化,我們也利用了 xs 函數來進階了解...

鐵人賽 AI & Data DAY 24

技術 Ɖ24-溫沙拉/ 自定義欄目大小與內容

在溫沙拉結束後 After the Salade Tiede 還記得前幾天我們提到"Salade Tiede"的意思,溫沙拉的本質並未從沙拉做改變,而是在既有的...

鐵人賽 AI & Data DAY 9

技術 [Day 9] Anonymized data 匿名資料

Anonymized data 匿名是保護資料免於用來找出真實資料的一種模式, 例如雜湊 hash 處理較敏感或機密的資料, 參賽者可透過合法的方式解匿名, 例...

鐵人賽 AI & Data DAY 21

技術 Ɖ21-溫沙拉/ 進階樞紐分析呈現與過濾式

進階樞紐分析表 Pivot table 延續上一篇的 pandas pivot_table 函數以及數據分析與思考基本問題。 2021 - juck3080...

鐵人賽 AI & Data DAY 12

技術 Ɖ12-榫卯/ 利用 Python 完成 Vlookup !超級好用的 FuzzyWuzzy

Vlookup 的好朋友 FuzzyWuzzy Vlookup 是我們很常使用的 Excel 功能,他幫我們達成快速匹配數值,當我們需要找到 A 所對應的 B...

鐵人賽 AI & Data DAY 14

技術 [Day 14] 以 Springleaf competition 實作 EDA

步驟 step 0 kaggle 網站找一個預測(結果是0或1)競賽 step 1 import libraries step 2 load the data...

鐵人賽 AI & Data DAY 10

技術 Ɖ10-榫卯/ 利用分組 Python 方式計算加權平均數

更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...

鐵人賽 AI & Data DAY 5

技術 [Day 5] Datetime Feature 與 Coordinate Feature (座標)

Datetime Feature 1. 週期性 - 週間星期或月, 季, 年, 秒, 分, 時等, 特別是規律性的 pattern2. 自特定(事件/活動)時間...

鐵人賽 AI & Data DAY 20

技術 Ɖ20-溫沙拉/ 進階樞紐分析表

進階樞紐分析表 Pivot table 回歸昨天提到的,大多數人可能都有在Excel中使用透視表的經驗。 Pandas 提供了一個類似的函數,叫做 Pivot_...

鐵人賽 AI & Data DAY 18

技術 Ɖ18-溫沙拉/ 簡單樞紐分析與快速分析式輸出

溫沙拉 Salade Tiede 溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與...

鐵人賽 AI & Data DAY 30

技術 Ɖ30-結語/ 先別急著停下腳步

先別急著停下腳步 清華大學的彭明輝老師在他的碩士新生手冊中,有寫到這句讓人感到玩味的話「什麼時候需要讀完弄懂一篇論文所有的恆等式推導過程? NEVER 你只需要...

鐵人賽 AI & Data DAY 25

技術 Ɖ25-布朗尼/ Numpy 多維陣列呈現

布朗尼 Chocolate brownie 邁入倒數的五天了,轉眼間發現30天的挑戰賽其實過得非常快,許多內容皆在轉眼間。而最後一篇章節我所要講的主題稱為布朗尼...

鐵人賽 AI & Data DAY 12

技術 [Day 12] Validation / 驗證 - Part I

Validation / 驗證 了解驗證和 overfitting 過度擬合的概念 確定應進行的分割數以建立穩定的驗證 用在比賽中進行訓練/測試分割的最常用方...

鐵人賽 AI & Data DAY 14

技術 Ɖ14-香料/ pd.merge 資料檔案合併分類計算

文件解析與數據清理 昨天介紹了多個Excel文件合併數據與清理數據的流程,Python 和 Pandas 的結合對於整個操作而言是非常強大,它的可擴展性和功能更...

鐵人賽 AI & Data DAY 29

技術 Ɖ29-布朗尼/ Pandas 的缺失值處理與應用

處理缺失數據 真實的數據很少是乾淨的。更常見的情況是,很多有意思的數據集都有很多的數據缺失。更複雜的是,不同的數據源可能有著不同指代缺失數據的方式,我們會將這些...

鐵人賽 AI & Data DAY 1

技術 [Day00] 這次可以跟上 Kaggle 30 Days 挑戰了吧

前言 寫在前面Kaggle 不知道從何時開始,每年會有一段時間舉辦 30 days challenge(應該是2018年,然後是為了推進大家使用 Kaggle,...

鐵人賽 AI & Data DAY 22

技術 Ɖ22-溫沙拉/ 進階樞紐匯出報表

樞紐匯出表 Reports from Pivot Table 上一篇關於數據透視表的文章描述瞭如何使用 pandas 的 pivot_table 功能將數據以一...