表情資料集的介紹與下載 俗話說:「知己知彼,百戰百勝」,這句話同樣也適合用在資料科學上,我們必須對資料的背景非常熟悉,才能夠設計出適合的演算法。今天,讓我介紹這...
從文字或影像提取特徵 Feature extraction from texts, images純 Text 競賽: Allen AI challenge純 I...
香料 Spices 辛香料的搭配是我很愛的一種料理方法,利用非常天然簡單的香料,點綴著原先澀澀略腥的料理,他不經過多的加工,早期甚至應用於藥材,帶給他一層神秘的...
kaggle網站重點 Data : 資料的區塊有兩個重點, description 跟 rules 要研讀清楚, 尤其是 rulesModel : 建模要發揮最...
一些在 Python 簡單的,在 Excel 會很複雜的事情 結束上次提及的加權平均數,這次的目的是展示一些常見的 Excel 任務,以及你如何在 pandas...
之前沒整理程式碼的習慣經常想到某些程式碼就要翻以前寫的覺得有點浪費時間 之後有用到就貼上來 慢慢更新然後我會打一些關鍵字方便自己用Ctrl + F 搜尋 #ka...
2. Ordinal Feature 回到 Titanic dataset, 無庸置疑 三個features 'sex, cabin, embarked' 都是...
榫卯,如同拼圖一樣組合起結構 榫卯,是中國傳統木工中接合建築與結構的方式,利用榫頭插入另一個的卯眼中,使兩個構件連接並固定,與現代工藝不同的地方在於榫和卯眼之間...
為什麼選這個主題? 學習來源是 coursera 的一群年輕人在前 top 1 kaggler Alexander Djakonov 教導 ML 跟 kaggl...
week 1 是 亞歷珊卓主講, 看了一個禮拜, 一次又一次反覆的看著, 聽者俄式英文加上不僅神似 NPH (Neil Patrick Harris in ho...
第一週曾有說過天下沒白吃的午餐, 預處理後的重點仍是瞭解資料, EDA 幫助我們找出資料 insight , 理出真正的問題, 才能有對的, 好的解決方法, 不...
成功打印出樞紐分析表後 Pivot Table Print 提及了如何利用 get_level_values 來使工作自動化,我們也利用了 xs 函數來進階了解...
Vlookup 的好朋友 FuzzyWuzzy Vlookup 是我們很常使用的 Excel 功能,他幫我們達成快速匹配數值,當我們需要找到 A 所對應的 B...
進階樞紐分析表 Pivot table 延續上一篇的 pandas pivot_table 函數以及數據分析與思考基本問題。 2021 - juck3080...
在溫沙拉結束後 After the Salade Tiede 還記得前幾天我們提到"Salade Tiede"的意思,溫沙拉的本質並未從沙拉做改變,而是在既有的...
Dataset cleaning Constant features 重複特徵 Duplicated features Constant features...
先說點時事, 今天凌晨有 iPhone 11 發表會, 為了 AI 有新增一個 Core ML 庫可讓開發者調用. 回到 kaggle 比賽的準備. EDA 是...
更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...
Anonymized data 匿名是保護資料免於用來找出真實資料的一種模式, 例如雜湊 hash 處理較敏感或機密的資料, 參賽者可透過合法的方式解匿名, 例...
步驟 step 0 kaggle 網站找一個預測(結果是0或1)競賽 step 1 import libraries step 2 load the data...
Datetime Feature 1. 週期性 - 週間星期或月, 季, 年, 秒, 分, 時等, 特別是規律性的 pattern2. 自特定(事件/活動)時間...
進階樞紐分析表 Pivot table 回歸昨天提到的,大多數人可能都有在Excel中使用透視表的經驗。 Pandas 提供了一個類似的函數,叫做 Pivot_...
先別急著停下腳步 清華大學的彭明輝老師在他的碩士新生手冊中,有寫到這句讓人感到玩味的話「什麼時候需要讀完弄懂一篇論文所有的恆等式推導過程? NEVER 你只需要...
布朗尼 Chocolate brownie 邁入倒數的五天了,轉眼間發現30天的挑戰賽其實過得非常快,許多內容皆在轉眼間。而最後一篇章節我所要講的主題稱為布朗尼...
溫沙拉 Salade Tiede 溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與...
標題提到一堆技術名詞...別擔心,今天都會串起來,像一個偵探故事一樣,每種技術都是線索,幫助我們揪出到底誰找 AI 當槍手。👀 前言 昨天我們聊到僅用「錯字率」...
前面介紹的方法又是擴增一堆訓練數據集,又是 ensemble 一堆不同架構、不同訓練方法的模型,真的心滿累的。 所以,今天要跟大家分享的是本次賽題第八名的作法,...
文件解析與數據清理 昨天介紹了多個Excel文件合併數據與清理數據的流程,Python 和 Pandas 的結合對於整個操作而言是非常強大,它的可擴展性和功能更...
進階試算表工作 Advance Excel Tasks 今天是香料系列的最後一篇文章,代表著我們組合 Python 的功能講的差不多了,今天終於來到久久沒有說到...
今天來學習一下第一名和第三名包山包海的 ensemble 大法。 🥇1st Solution 第一名的解法不愧是第一名,他們真的花好多 effort 在解這個賽...