HuggingFace 是一個更正式的模型下載平台,並提供多種模型選擇,也讓開發者可以尋找其他人 fine-tune 過的模型。
首先,進入 Model Hub 的頁面,可以看到下方分別有 models, spaces, datasets 三種類別。
以 meta-llama/Meta-Llama-3.1-8B-Instruct 為例,進入頁面後,在模型名稱下方可以看到該模型的重點摘要。開發過程中,通常會參考模型的主要功能在模型使用上,依據 license 的不同會有不同的使用限制。以下列出幾種常見的開源授權條款: (Text Generation
)、支援語言、以及商用開模模型的 License 規範 (Llama 3.1 Community License Agreement
)。
除了 HuggingFace 之外,Llama 3.1 也有在 GitHub 上提供更詳細的模型資訊、模型評比結果、各評比項目的說明、以及最重要的 License 商業授權說明。
如同開源項目的提供,在模型使用上也會依照 license 有不同的限制,以下整理常見的使用許可:
License | 特點 | 使用限制 | 嚴謹程度 |
---|---|---|---|
MIT License | 簡單且寬鬆,允許自由使用、修改、分發,適用於開源和商業用途。 | 需保留原版權聲明和許可條款,無其他限制。 | 低 |
GNU GPL (v2/v3) | 強制開源,任何修改或衍生品都必須在相同條款下發佈,保護開源精神。 | 修改或衍生品需遵守相同GPL條款,整合軟體也需開源。 | 高 |
Apache License 2.0 | 允許自由使用、修改、分發,並提供專利授權保護,適合商業應用。 | 需保留版權聲明,修改需註明,適合商業應用但要注意專利保護。 | 中 |
BSD License | 提供較高的靈活性,允許自由使用、修改和發布,商業項目也適用。 | 需保留版權聲明,禁止使用原作者名稱作宣傳。 | 低 |
MPL 2.0 | 允許部分文件在開源條款下修改,並允許開源與內部代碼共存。 | 修改的部分需公開,但可與內部代碼一起使用。 | 中 |
The Unlicense | 完全放棄版權,作品置於公有領域,允許任何人自由使用、修改和發布。 | 無限制,完全自由使用,無需提及原作者。 | 低 |
HuggingFace 還是一個供開發者存放模型和資料的平台,Llama 3.1 的模型資料就可以在這個 Repo中查看,包含使用資訊、config、model 和 tokenizer。
看完了模型資訊後,就可以進入正式下載流程。
這裡依照官方的下載流程:
pip install llama-toolchain
下載操作套件llama model list
查看所有模型資訊llama download --source meta --model-id Meta-Llama3.1-8B-Instruct
下載模型
git lfs install
確認已經安裝 gitgit clone https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct
下載模型ref.