iT邦幫忙

2024 iThome 鐵人賽

DAY 17
0
生成式 AI

Gemini 多模態大型語言模型大小事系列 第 17

Gemini 多模態大型語言模型大小事 Day17 - 嵌入 Gemini API

  • 分享至 

  • xImage
  •  

前言

    程式環境都會用colab 來執行程式,如果要在其他環境執行,請自行修改哦

colab 事前準備:設定專案和 API 金鑰
載入gemini

#pip install -q -U google-generativeai
import google.generativeai as genai

API 金鑰

from google.colab import userdata
API_KEY=userdata.get('GOOGLE_API_KEY')

#genai.configure(api_key="YOUR_API_KEY")

# Configure the client library by providing your API key.
genai.configure(api_key=API_KEY)

嵌入 Gemini API

什麼是嵌入?

文字嵌入是一種自然語言處理 (NLP) 技術 將文字轉換成數值座標 (稱為「向量」),您可以 ND 空間。這個方法可以將文字片段視為 可用來訓練模型的關聯資料

嵌入功能可擷取語意含義和背景資訊,藉此產生文字 類似含量的嵌入例如:「我拿走 「dog to the vet」以及「我將貓帶到獸醫」會含有 在向量空間中彼此相近,因為兩者都形塑了 相關資訊

您可以使用嵌入功能比較不同文字,並瞭解這些文字會如何 關係舉例來說,如果嵌入的是「cat」文字和「dog」差一點。 就能推斷出這些字詞的意思或情境相似 兩者。

用途

文字嵌入可用於多種自然語言處理用途,例如:

  • 資訊擷取:您可以使用嵌入功能,在語意上擷取內容 所提供的類似文字各種應用程式 「語意搜尋」等 回答問題或總結
    • 教學課程:文件搜尋
  • 分類:您可以使用嵌入項目訓練模型,以便進行分類 並將這些文件分門別類例如,如想將使用者分類 您可以使用嵌入服務來取得 以訓練分類器來訓練分類器。
    • 教學課程:訓練文字 分類器
  • 分群:比較文字向量可顯示相似或相異之處 其次是可行的這項功能可用來訓練分群模型 偵測資料中的異常狀況
    • 教學課程:訓練分群法 模型、偵測資料 異常狀況
  • 向量資料庫:您可以將產生的嵌入儲存在向量中 資料庫,提升自然語言處理應用程式的準確度和效率。 請參閱 下列教學課程,瞭解如何使用向量資料庫 將文字提示轉換成數值向量
    • 教學課程:使用向量 嵌入 語意擷取

使用 Gemini API 產生嵌入項目

result = genai.embed_content(
    model="models/text-embedding-004",
    content="生命的意義是什麼?",
    task_type="retrieval_document",
    title="嵌入單一字串")

# 1 input > 1 vector output
print(str(result['embedding'])[:50], '... TRIMMED]')

[0.0024564546, 0.022666605, -0.01602594, -0.007231 ... TRIMMED]


上一篇
Gemini 多模態大型語言模型大小事 Day16 - 按照系統指示引導模型行為
下一篇
Gemini 多模態大型語言模型大小事 Day18 - 透過嵌入進行異常偵測
系列文
Gemini 多模態大型語言模型大小事18
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言