Falcon 是由技術創新研究所 (TII) 建立的大型語言模型,用於摘要、文本生成和聊天機器人。

7b 40b 180b

70.2K 16 個月前

16 個月前

b4137657e4e9 · 24GB

模型
falcon
·
41.8B
·
Q4_0

自述檔案

Technology Innovation Institute Logo

Falcon 是由技術創新研究所 (TII) 開發的一系列高效能大型語言模型。技術創新研究所 (TII) 是阿布達比政府先進技術研究委員會轄下,負責監督技術研究的研究中心。

CLI

ollama run falcon "Why is the sky blue?"

API

curl -X POST https://127.0.0.1:11434/api/generate -d '{
  "model": "falcon",
  "prompt": "Why is the sky blue?"
}'

參數計數

參數計數 建議記憶體
70 億 8GB 查看 ollama run falcon:7b
400 億 32GB 查看 ollama run falcon:40b
1800 億 192GB 查看 ollama run falcon:180b

變體

聊天 聊天模型在聊天和指令數據集上進行了微調,其中混合了多個大型對話數據集。
指令 指令模型遵循指令,並在 baize 指令數據集上進行了微調。
文本 文本模型是基礎模型,未針對對話進行任何微調,最適合用於簡單的文本完成任務。

Falcon 180B

截至 2023 年 9 月,1800 億參數模型 Falcon 180B 是效能最佳的公開發布 LLM。其效能介於 OpenAI 的 GPT 3.5 和 GPT 4 之間。為了運行 Falcon 180B,建議使用至少 192GB 總記憶體的強大系統。

注意:Falcon 180B 的發布許可協議與其較小的型號不同,在某些條件下限制商業用途。有關更多資訊,請參閱模型詳細資訊和許可協議。

更多資訊