Falcon 是一個大型語言模型,由科技創新研究院 (Technology Innovation Institute, TII) 建構,用於摘要、文本生成和聊天機器人。

7b 40b 180b

70.2K 16 個月前

說明文件

Technology Innovation Institute Logo

Falcon 是一系列高效能大型語言模型,由科技創新研究院 (TII) 建構,該研究中心隸屬於阿布達比政府的先進科技研究委員會,負責監督科技研究。

CLI (命令列介面)

ollama run falcon "Why is the sky blue?"

API (應用程式介面)

curl -X POST https://127.0.0.1:11434/api/generate -d '{
  "model": "falcon",
  "prompt": "Why is the sky blue?"
}'

參數計數

參數計數 建議記憶體
70 億 8GB 檢視 ollama run falcon:7b
400 億 32GB 檢視 ollama run falcon:40b
1800 億 192GB 檢視 ollama run falcon:180b

變體版本

chat (聊天) 聊天模型在聊天和指令資料集上進行微調,其中混合了多個大型對話資料集。
instruct (指令) 指令模型遵循指令,並在 baize 指令資料集上進行微調。
text (文本) 文本模型是未經任何對話微調的基本基礎模型,最適合用於簡單的文本補全。

Falcon 180B

截至 2023 年 9 月,1800 億參數模型 Falcon 180B 是效能最佳的公開發布 LLM。其效能介於 OpenAI 的 GPT 3.5 和 GPT 4 之間。為了運行 Falcon 180B,建議使用具有至少 192GB 總記憶體的強大系統。

注意:Falcon 180B 的發布授權條款與其較小型的同系列模型不同,在特定條件下限制商業用途。請參閱模型詳情和授權條款以獲取更多資訊。

更多資訊