今天我們把所有前面所用過的爬蟲、讀取權重、分類全融合在一起,把我們所學全部把它並一起運用,我們可以以這方式來幫我們快速爬蟲獲取資料,並讓模型幫我們分類,我們可以...
文件關鍵字
關鍵字的重要性
前面先註明一下,本文大幅參考An Evaluation on Feature Selection for Text Clusteri...
為什麼要談回測風險?
回測是一個在量化投資界很重要但也容易被誤解的概念。很多人把它當作一種研究工具,但其實這很危險。大多數學術論文裡面的回測通常有錯誤,主要是因...
從 2022 年底爆發的生成式 AI 熱潮,以及它所依賴的大型語言模型(LLM),肯定會對資料工程與資料科學產生重大的影響。這幾年我們團隊看到的商用版本 MLO...
前面我們介紹的幾個AI作曲工具,雖然各家各有各的技術,但以最基本的層面來說,絕大部分都是在Midi檔案上面在做創作,再透過一些後續的處理來生成完整的樂曲,而接下...
在一個二元分類模型中,我們的目標是預測兩個可能的結果之一,但在一般情況下,模型不會直接輸出 0 或 1 以確定分類,而是會為每個可能的分類輸出一個機率值,然後這...