或許有時候你會覺得「這個人講話好模糊喔,沒有重點」,聽完他”落落長”的發表之後還是搞不清楚他要表達甚麼,prompt 就是在讓人講話變得「有重點」。那麼該怎麼做呢?讓我們繼續看下去。
提示詞(Prompt)指的是算法輸出之前的那段前置左向字符串。比如最早 MSDOS 下的 C:\>
,Linux 下的~:
,Python 下面的>>>
這些都算是提示詞,現今提示詞已經成為大型規模語言(LLMs)互動最值觀的方式。
身為一個好的提示詞,有幾個特點:
避免過於廣泛籠統的問題,要提供具體信息或有明確目的。你希望得到甚麼資訊?可從人、事、時、地、物發想。
避免使用模糊不清、模稜兩可或是過於複雜冗長的詞語。簡單的問題更容易理解與回答。
建議提示主題、領域相同,主題過於發散可能會分散討論焦點。或是與上下文相關,提供問題的背景,方便理解回答。
補全系統,簡單來說他就是模型的回答。
當你輸入了文本提示,模型就會生成一個文本補全,不僅僅是傳統語言模型能做到的情感分類及命名實體識別,他還可以做到,文本生成、翻譯、摘要、擴展、對話、代碼生成,甚至是語言理解。
當提示輸入模型時,他會變切割成token來理解和處理文本。
Token 可以是單詞也可以只是字符,是語言模型中表示字彙的基本單位。
在API中回答的長度也是透過限制一次回答使用多少tokens來規範。
-1個token約等於4個英文字符, 約等於3/4個英文單字。
-1500個中文字約等於2048個tokens。
在ChatGPT中,每個token都有對應的向量(embeddings),這些向量可以用來判斷token間的語意關係,就能組合成有意義的文本。
對於現在的GPT3.5而言,最多生成4096個tokens,否則回答就會錯誤或者是被截斷。
這樣看完是不是還是對prompt engineering感覺到有點模糊呢?
明天我們會深入介紹prompt記得要準時收看喔!
參考網站:
https://medium.com/dean-lin/%E5%A6%82%E4%BD%95%E5%AF%AB%E5%87%BA%E6%9C%89%E6%95%88%E7%9A%84-prompt-%E7%8D%B2%E5%BE%97%E6%9B%B4%E5%A5%BD%E7%9A%84-chatgpt-%E5%9B%9E%E8%A6%86-b9dc0bb56b68
https://hello-kirby.hashnode.dev/openai-api