iT邦幫忙

kaggle相關文章
共有 70 則文章
鐵人賽 AI & Data DAY 2

技術 [Day 02] 在表情資料尋找邂逅是否搞錯了甚麼 (Facial Expression Recognition)

表情資料集的介紹與下載 俗話說:「知己知彼,百戰百勝」,這句話同樣也適合用在資料科學上,我們必須對資料的背景非常熟悉,才能夠設計出適合的演算法。今天,讓我介紹這...

鐵人賽 AI & Data DAY 6

技術 [Day 6] bag of words / BOW 詞袋

從文字或影像提取特徵 Feature extraction from texts, images純 Text 競賽: Allen AI challenge純 I...

鐵人賽 AI & Data DAY 13

技術 Ɖ13-香料/ 大量 Excel 資料檔案合併

香料 Spices 辛香料的搭配是我很愛的一種料理方法,利用非常天然簡單的香料,點綴著原先澀澀略腥的料理,他不經過多的加工,早期甚至應用於藥材,帶給他一層神秘的...

鐵人賽 AI & Data DAY 2

技術 [Day 2] kaggle網站重點/ 規劃 pipeline

kaggle網站重點 Data : 資料的區塊有兩個重點, description 跟 rules 要研讀清楚, 尤其是 rulesModel : 建模要發揮最...

鐵人賽 AI & Data DAY 11

技術 Ɖ11-榫卯/ 一些在 Python 簡單的,在 Excel 會很複雜的事情

一些在 Python 簡單的,在 Excel 會很複雜的事情 結束上次提及的加權平均數,這次的目的是展示一些常見的 Excel 任務,以及你如何在 pandas...

技術 深度學習常用程式碼

之前沒整理程式碼的習慣經常想到某些程式碼就要翻以前寫的覺得有點浪費時間 之後有用到就貼上來 慢慢更新然後我會打一些關鍵字方便自己用Ctrl + F 搜尋 #ka...

鐵人賽 AI & Data DAY 9

技術 Ɖ9-榫卯/ 利用多種 Python 方式簡單計算加權平均數

榫卯,如同拼圖一樣組合起結構 榫卯,是中國傳統木工中接合建築與結構的方式,利用榫頭插入另一個的卯眼中,使兩個構件連接並固定,與現代工藝不同的地方在於榫和卯眼之間...

鐵人賽 AI & Data DAY 1

技術 [Day 1] 跟top kaggler學習如何贏得資料分析競賽 - 4周主題架構

為什麼選這個主題? 學習來源是 coursera 的一群年輕人在前 top 1 kaggler Alexander Djakonov 教導 ML 跟 kaggl...

鐵人賽 AI & Data DAY 7

技術 [Day 7] Word2vec, CNN

week 1 是 亞歷珊卓主講, 看了一個禮拜, 一次又一次反覆的看著, 聽者俄式英文加上不僅神似 NPH (Neil Patrick Harris in ho...

鐵人賽 AI & Data DAY 8

技術 [Day 8] EDA / Exploratory Data Analysis

第一週曾有說過天下沒白吃的午餐, 預處理後的重點仍是瞭解資料, EDA 幫助我們找出資料 insight , 理出真正的問題, 才能有對的, 好的解決方法, 不...

鐵人賽 AI & Data DAY 23

技術 Ɖ23-溫沙拉/ 簡單 Pandas 匯出報表至 Excel

成功打印出樞紐分析表後 Pivot Table Print 提及了如何利用 get_level_values 來使工作自動化,我們也利用了 xs 函數來進階了解...

鐵人賽 AI & Data DAY 12

技術 Ɖ12-榫卯/ 利用 Python 完成 Vlookup !超級好用的 FuzzyWuzzy

Vlookup 的好朋友 FuzzyWuzzy Vlookup 是我們很常使用的 Excel 功能,他幫我們達成快速匹配數值,當我們需要找到 A 所對應的 B...

鐵人賽 AI & Data DAY 21

技術 Ɖ21-溫沙拉/ 進階樞紐分析呈現與過濾式

進階樞紐分析表 Pivot table 延續上一篇的 pandas pivot_table 函數以及數據分析與思考基本問題。 2021 - juck3080...

鐵人賽 AI & Data DAY 24

技術 Ɖ24-溫沙拉/ 自定義欄目大小與內容

在溫沙拉結束後 After the Salade Tiede 還記得前幾天我們提到"Salade Tiede"的意思,溫沙拉的本質並未從沙拉做改變,而是在既有的...

鐵人賽 AI & Data DAY 10

技術 [Day 10] Visualizations / 視覺化

先說點時事, 今天凌晨有 iPhone 11 發表會, 為了 AI 有新增一個 Core ML 庫可讓開發者調用. 回到 kaggle 比賽的準備. EDA 是...

鐵人賽 AI & Data DAY 10

技術 Ɖ10-榫卯/ 利用分組 Python 方式計算加權平均數

更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...

鐵人賽 AI & Data DAY 9

技術 [Day 9] Anonymized data 匿名資料

Anonymized data 匿名是保護資料免於用來找出真實資料的一種模式, 例如雜湊 hash 處理較敏感或機密的資料, 參賽者可透過合法的方式解匿名, 例...

鐵人賽 AI & Data DAY 14

技術 [Day 14] 以 Springleaf competition 實作 EDA

步驟 step 0 kaggle 網站找一個預測(結果是0或1)競賽 step 1 import libraries step 2 load the data...

鐵人賽 AI & Data DAY 5

技術 [Day 5] Datetime Feature 與 Coordinate Feature (座標)

Datetime Feature 1. 週期性 - 週間星期或月, 季, 年, 秒, 分, 時等, 特別是規律性的 pattern2. 自特定(事件/活動)時間...

鐵人賽 AI & Data DAY 20

技術 Ɖ20-溫沙拉/ 進階樞紐分析表

進階樞紐分析表 Pivot table 回歸昨天提到的,大多數人可能都有在Excel中使用透視表的經驗。 Pandas 提供了一個類似的函數,叫做 Pivot_...

鐵人賽 AI & Data DAY 30

技術 Ɖ30-結語/ 先別急著停下腳步

先別急著停下腳步 清華大學的彭明輝老師在他的碩士新生手冊中,有寫到這句讓人感到玩味的話「什麼時候需要讀完弄懂一篇論文所有的恆等式推導過程? NEVER 你只需要...

鐵人賽 AI & Data DAY 25

技術 Ɖ25-布朗尼/ Numpy 多維陣列呈現

布朗尼 Chocolate brownie 邁入倒數的五天了,轉眼間發現30天的挑戰賽其實過得非常快,許多內容皆在轉眼間。而最後一篇章節我所要講的主題稱為布朗尼...

鐵人賽 AI & Data DAY 18

技術 Ɖ18-溫沙拉/ 簡單樞紐分析與快速分析式輸出

溫沙拉 Salade Tiede 溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與...

鐵人賽 AI/ ML & Data DAY 27

技術 [Day 27]照妖(AI)鏡下的秘密-利用TF-IDF、BPE編碼、Kmeans Cluster和DetectGPT技術區分人類與AI寫作

標題提到一堆技術名詞...別擔心,今天都會串起來,像一個偵探故事一樣,每種技術都是線索,幫助我們揪出到底誰找 AI 當槍手。👀 前言 昨天我們聊到僅用「錯字率」...

鐵人賽 AI/ ML & Data DAY 30

技術 [Day 30]告別複雜巨獸 - 一起看第八名的小清新解法與IT鐵人賽後回望

前面介紹的方法又是擴增一堆訓練數據集,又是 ensemble 一堆不同架構、不同訓練方法的模型,真的心滿累的。 所以,今天要跟大家分享的是本次賽題第八名的作法,...

鐵人賽 AI & Data DAY 14

技術 Ɖ14-香料/ pd.merge 資料檔案合併分類計算

文件解析與數據清理 昨天介紹了多個Excel文件合併數據與清理數據的流程,Python 和 Pandas 的結合對於整個操作而言是非常強大,它的可擴展性和功能更...

鐵人賽 AI & Data DAY 17

技術 Ɖ17-香料/ Excel 的進階尋找過濾

進階試算表工作 Advance Excel Tasks 今天是香料系列的最後一篇文章,代表著我們組合 Python 的功能講的差不多了,今天終於來到久久沒有說到...

鐵人賽 AI/ ML & Data DAY 29

技術 [Day 29]模型與資料的超級 ensemble 體 - 淺談 Curriculum Learning 訓練方法與 Ghostbuster (捉鬼人)如何識別 AI 和人類作文

今天來學習一下第一名和第三名包山包海的 ensemble 大法。 🥇1st Solution 第一名的解法不愧是第一名,他們真的花好多 effort 在解這個賽...