由技術創新研究院 (Technology Innovation Institute, TII) 建構的大型語言模型,用於摘要、文本生成和聊天機器人。

7b 40b 180b

70.2K 16 個月前

Readme

Technology Innovation Institute Logo

Falcon 是由技術創新研究院 (TII) 建構的高效能大型語言模型系列,該研究院是阿拉伯聯合大公國阿布達比政府轄下先進技術研究委員會 (Advanced Technology Research Council) 的研究中心,負責監督技術研究。

CLI

ollama run falcon "Why is the sky blue?"

API

curl -X POST http://localhost:11434/api/generate -d '{
  "model": "falcon",
  "prompt": "Why is the sky blue?"
}'

參數計數

參數計數 建議記憶體
70 億 8GB 檢視 ollama run falcon:7b
400 億 32GB 檢視 ollama run falcon:40b
1800 億 192GB 檢視 ollama run falcon:180b

變體

chat Chat 模型在聊天和指令數據集上進行微調,其中混合了多個大型對話數據集。
instruct Instruct 模型遵循指令,並在 baize 指令數據集上進行微調。
text Text 模型是基礎模型,未針對對話進行任何微調,最適合用於簡單的文本完成。

Falcon 180B

截至 2023 年 9 月,1800 億參數模型 Falcon 180B 是效能最佳的公開發布 LLM。其效能介於 OpenAI 的 GPT 3.5 和 GPT 4 之間。為了運行 Falcon 180B,建議使用至少 192GB 總記憶體的強大系統。

注意:Falcon 180B 的發布許可與其較小的同系列模型不同,後者限制了在某些條件下的商業用途。請參閱模型詳細資訊和許可證以獲取更多資訊。

更多資訊