2023 iThome 鐵人賽
帶我們前進的 是想證明自己的力量
AI & Data
選手 121 文章 2526
Day 28
2023-10-13
1804
0
NLP步驟 將文件收集到語料庫內 基元化(語彙基元tokens) 句子基元化&偵測語言 文本通常被分割成句子 pip install langde...
Day 28
2023-10-13
905
0
程式碼這次參賽的程式碼都會放在 Big-Data-Framework-30-days,建議大家直接把整個 repo clone 下來,然後參考 README...
Day 28
2023-10-13
1761
0
今天就要來進入這個專案啦 這邊先付上這個github專案的網址:https://github.com/Plachtaa/VITS-fast-fine-tunin...
Day 28
2023-10-13
850
0
之前談到效能改進時,有個關鍵點可以決定事倍功半或是事半功倍:「是否有利用工具去對系統內部做量測?」 很多時候,因為關鍵的性質難以量測或是預測,取而代之的替代方案...
Day 28
2023-10-13
546
0
文字探勘應用案例 應用案例 - 清資料與斷詞 我們來看要如何處理爬下的資料吧! 這次我們會應用最近正在風口浪尖的中研院ckip小組開發出的斷詞系統,所以開始時要...
Day 28
2023-10-13
734
0
Mark Duplicates # ----------------------------------------- # STEP 3: Mark Dupli...