第3篇(Sec.3) 觀察CLIP訓練過程的<相似度>變化

2023 iThome 鐵人賽

DAY 0

AI & Data

如何將AIGC大模型開源程式碼，訓練成自用小模型系列第 2 篇

15th鐵人賽

misoo

2023-09-18 23:39:50

662 瀏覽

分享至

在CLIP裡，以矩陣運算來計算出相似度，並以矩陣來呈現，如下圖：

我們拿CLIP源代碼來實際進行訓練，在其過程中逐漸地修正CLIP模型裡的參數(即weight和bias值)，也就是逐漸地調整潛藏空間裡各點的位置(座標)，並以陣列運算來計算出各圖像與各文本之間的相似度。在本範例裡，我們把CLIP程式碼包裝於Excel後面，如下圖：

 首先按下<訓練1回合>，就輸出各圖像與各文本之間的相似度，如下圖：
 
![https://ithelp.ithome.com.tw/upload/images/20230918/20163333ZDz1soZ1kY.png](https://ithelp.ithome.com.tw/upload/images/20230918/20163333ZDz1soZ1kY.png) 
 
  從上圖的相似度矩陣裡的值，還看不出來明顯的相似度差異。於是來加碼進行100回合訓練，完成之後，再以陣列呈現最新的相似度。如下圖：

上圖的相似度矩陣裡的值，仍然看不出來明顯的相似度差異。於是加碼進行300回合的訓練，完成之後，再以陣列呈現最新的相似度。如下圖：


![https://ithelp.ithome.com.tw/upload/images/20230918/20163333ZAXIT3OgDn.png](https://ithelp.ithome.com.tw/upload/images/20230918/20163333ZAXIT3OgDn.png)


  這時從相似度矩陣已經可以看出來，明顯的相似度差異。例如，<圖像-3>與<提詞-3>相似度提高了。接著，再加碼進行500回合的訓練，完成之後，再以陣列呈現最新的相似度。如下圖：

這時從相似度矩陣可以更明顯地看出來其相似度的差異。例如，<圖像-2>與<提詞-2>相似度提高了。

第2篇：大模型開源程式的挖礦(淘金)流程 ---- 以CLIP為例

系列文

如何將AIGC大模型開源程式碼，訓練成自用小模型共 2 篇

RSS系列文訂閱系列文

0 人訂閱

完整目錄

熱門推薦

用 Web API 打造文件閱讀器

iThome鐵人賽 | 2025-07-30 13:00

重建開發者的安全直覺

iThome鐵人賽 | 2025-08-06 13:00

隱私 & 區塊鏈

iThome鐵人賽 | 2025-08-13 13:00

Centralized CI/CD 策略的探索與實踐

Hello World Dev Conference |

37 分

尚未有邦友留言

立即登入留言

如何將AIGC大模型開源程式碼，訓練成自用小模型系列 第 2 篇

第3篇(Sec.3) 觀察CLIP訓練過程的<相似度>變化

尚未有邦友留言

標記使用者

如何將AIGC大模型開源程式碼，訓練成自用小模型系列第 2 篇