2022 iThome 鐵人賽
「連續 30 天發表技術文章不中斷」爆發驚人的技術能量,
寫出一整年的成長與學習。
AI & Data
選手 67 文章 1482
Day 25
2022-10-10
3526
0
很可惜,昨天太忙忘記撰寫第26天的文章,但我還是會完成30天的文章。 今日大綱 爬蟲介紹 搜尋HTML特定的標籤與屬性 搜尋CSS特定的屬性 CSS選擇器 其...
Day 9
2022-09-22
3523
0
今日大綱 什麼是決策樹 熵 (Entropy)與資訊增益 (Information gain) 基尼不純度 (Gini impurity) 優缺點 範例 什...
Day 3
2022-09-14
3515
1
R、Python在資料分析時常常使用到的基礎語法和指令 R 載入套件 載入資料、輸出資料、輸出圖片 建立資料、Dataframe R 常用的函式示範 R...
Day 19
2022-10-03
3509
0
語言模型(Language Models)是判斷一定長度的文字出現在句子的機率,生活中的語言模型你一定用過,而且每天有數十億人在用,可以算是最常用的 NLP 應...
Day 22
2022-09-26
3505
0
DBSCAN的問題 我們昨天提到了分群演算法DBSCAN的分群原理,也提到了密度不同會導致的問題,你可能會覺得這是一個小問題,但在實際使用上卻因這個密度,從而導...
Day 6
2022-09-17
3501
0
造成遺失值的機制可分為三大類, 完全隨機遺失(missing completely at random, MCAR)遺失值的產生皆為隨機的 隨機缺失(m...