第三週做完,真的覺得跟前兩週完全不一樣。前半段我還在跟GPT-2和Qwen mini這些小模型奮戰,每次跑出來不是文字接龍,就是蛇蛇蛇無限重複,雖然好笑,但完全...
Transformer 是深度學習領域中最具代表性的模型之一,自 2017 年由 Vaswani 等人提出以來,已成為自然語言處理(NLP)與電腦視覺(CV)等...
昨天設計完 Todo List Memory,今天迫不及待地來跑實驗看看效果。理想很豐滿,現實卻有點骨感。
實驗結果
先上圖:
數據顯示:
在 hop=3...
一、系統架構
核心流程:
前端 (Streamlit):作為使用者介面,接收提問。
Gemini 模型 (核心):處理提問,並根據指令決定下一步。...
為什麼需要理解?這是 Transformer 厲害的關鍵。不懂它,就很容易把上下文塞爆。
白話定義
Attention=對關鍵位置加權,不是逐字平均掃
長距離依...
今天要延伸大綱了
1.簡介·在「olive young 簡介」中會提到他是韓國當地最大型的美妝及健康連鎖通路,其中是如何結合實體門市與線上購物,且透過網際網路將...