前言
在大型語言模型的領域,除了GPT-3中提到的Prompting與Few-shot等技術之外,還有許多衍生的應用。第一個應用是由於GPT-3生成的文字存在高...
在日本趕稿趕到快發瘋,如果有哪裡解釋不清楚的歡迎留言跟我說。hackMD原稿
昨天分享了如果是較為複雜的遊戲,可以使用審局函數來限制Minimax的搜索深度...
在今日教學中,我們將學習如何結合 Stable Baselines 3 和之前大量篇幅介紹的 Backtrader,使用強化學習方法開發一個股票交易策略,終於有...
LSTM 長短期記憶網路
什麼是LSTM?
LSTM(Long Short-Term Memory)是一種特殊的循環神經網路(RNN),也就是昨天提到的RNN的...
昨天我們深入探討了 Q-learning 和深度 Q 網絡(DQN)的核心概念,理解了這些演算法如何讓機器在不斷學習中變得「聰明」。今天,我們將把理論付諸實踐,...
對圖像做 adversarial attack 可能你已經很熟悉了,今天帶大家來看看怎麼對文本做對抗攻擊。第一名的 solution 就使用到 adversar...