Gemini API 的函式呼叫是一項強大的功能,它讓大型語言模型(LLM)可以執行更複雜的任務。傳統上,LLM 主要用於生成文本,但函式呼叫則讓它們能夠與外部系統互動,執行計算,甚至控制其他應用程式。
簡單來說,就是讓 AI 不只會聊天,還能幫你做事。
1.模型識別: 當你向 Gemini 模型提出一個問題或請求時,模型會分析你的輸入,判斷是否需要執行特定的函式。
2.函式選擇: 如果模型決定需要執行函式,它會從你定義的一組函式中選擇最適合的函式。
3.參數傳遞: 模型會將必要的參數傳遞給所選的函式。
4.函式執行: 函式執行後,會將結果返回給模型。
5.模型整合: 模型會將函式的結果整合到它的回應中,提供給你更完整、更有用的資訊。
在 Gemini API 中,函式呼叫格式指的是我們在向模型發送請求時,用來定義函式、參數以及預期回傳值的 JSON 格式。這個格式決定了模型如何理解我們的指令,並執行相應的動作。
函式呼叫格式的關鍵元素
JSON
{
"functions": [
{
"description": "計算兩個數字的和",
"name": "add_numbers",
"parameters": {
"type": "object",
"properties": {
"x": {"type": "number"},
"y": {"type": "number"}
}
},
"return": {"type": "number"}
}
]
}
函式呼叫格式是 Gemini API 中一個強大的功能,它讓我們可以更靈活地定制模型的行為。通過合理地定義函式,我們可以讓模型執行更複雜的任務,實現更多的應用場景。