機器學習應用練習 :: 2019 iT 邦幫忙鐵人賽

catxxx519 (catxxx519)

iT邦見習生 ‧ 點數 72

10586

累計瀏覽數

3人

在追蹤

站內簡訊追蹤

鐵人檔案

2019 iT 邦幫忙鐵人賽

回列表

自我挑戰組

機器學習應用練習系列

在學習了pandas及SQL之後，認為自己在資料分析的思維上還太淺了，希望藉由機器學習練習的範例進一步了解應用的情境，能夠更深入挖掘資料的價值

鐵人鍊成｜共 30 篇文章｜ 19 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 1878 瀏覽

DAY 21

特徵調整

特徵調整原本今天想開始練習情感分析，讀了很多相關文章和snownlp庫覺得情感分析原理好像和文章分類方法類似，首先要有標註正面和負面的語料庫，才可以開始進行...

2018-11-05 ‧ 由 catxxx519 分享

0 Like 0 留言 1380 瀏覽

DAY 22

練習提高精確度

練習提高精確度今天從資料整理和特徵提取優化嘗試提高精確度首先是資料整理，新聞網站的原文大部分都長這樣（中央社北京6日綜合外電報導）微軟創辦人比爾．蓋茲今天...

2018-11-06 ‧ 由 catxxx519 分享

0 Like 0 留言 1955 瀏覽

DAY 23

從文本提取信息

從文本提取信息新聞分類到85%精確度就上不去了，再繼續探索nltk 信息提取信息有很多種形狀和大小。如果我們的數據是表格形式，那麼回答這些問題就很簡單了。...

2018-11-07 ‧ 由 catxxx519 分享

0 Like 0 留言 2315 瀏覽

DAY 24

標註IOB詞塊標記

標註IOB詞塊標記昨天定義了UnigramChunker類，使用一元標註器給句子加詞塊標記。這個類的大部分代碼只是用來在NLTK的ChunkParserI接口...

2018-11-08 ‧ 由 catxxx519 分享

0 Like 0 留言 1667 瀏覽

DAY 25

劃分詞塊

劃分詞塊訓練基於分類器的詞塊劃分器昨天透過train_sents訓練了標註器為詞性標記標註IOB詞塊標記，已經標記了93.3%的詞塊，再透過parse回...

2018-11-09 ‧ 由 catxxx519 分享

0 Like 0 留言 4108 瀏覽

DAY 26

分析句子結構

分析句子結構本章的目的是要回答下列問題：我們如何使用形式化語法來描述無限的句子集合的結構？我們如何使用句法樹來表示句子結構？語法分析器如何分析一個句子...

2018-11-10 ‧ 由 catxxx519 分享

0 Like 0 留言 2825 瀏覽

DAY 27

依存關係和依存文法

依存關係和依存文法短語結構文法是關於詞和詞序列如何結合起來形成句子成分的。一個獨特的和互補的方式，依存語法，集中關注的是詞與其他詞之間的關係。依存關係是一個中...

2018-11-11 ‧ 由 catxxx519 分享

0 Like 0 留言 2824 瀏覽

DAY 28

標註中文詞性

標註中文詞性 nltk.corpus內有sinica_treebank繁體中文的語料庫，用法和corpus內其他文章滿相似的 print(nltk.corpus...

2018-11-12 ‧ 由 catxxx519 分享

0 Like 0 留言 7773 瀏覽

DAY 29

中文情感分析練習

中文情感分析練習這幾天找到中文的情感字典，與之前不一樣的是這是字典而不是語料庫，所以想說能練習看看先把字典分別做成list with open('../di...

2018-11-13 ‧ 由 catxxx519 分享

1 Like 1 留言 15535 瀏覽

DAY 30

中文情感分析練習

中文情感分析練習 https://figshare.com/articles/___/6881282/1 今天在這裡找到新的情感字典，我覺得這是我目前找到最好的...

2018-11-14 ‧ 由 catxxx519 分享

catxxx519的鐵人檔案

catxxx519的收藏

catxxx519的追蹤

catxxx519的Like

catxxx519的紀錄

catxxx519的訂閱列表

鐵人檔案

機器學習應用練習 系列

標記使用者

機器學習應用練習系列