Phi-4 是微軟最先進的 14B 參數開放模型。

14b

1M 2 months ago

Readme

Phi-4 是一個 14B 參數、最先進的開放模型,建立於合成資料集、過濾後的公共領域網站資料,以及取得的學術書籍和問答資料集之上。

Phi-4 benchmark

此模型經過嚴格的增強和對齊流程,結合了監督式微調和直接偏好最佳化,以確保精確的指令遵循和穩健的安全措施。

上下文長度: 16k tokens

Phi-4 performance eval by Microsoft

主要使用案例

此模型旨在加速語言模型的研究,作為生成式 AI 驅動功能的建構模組。它為通用 AI 系統和應用程式(主要為英文)提供用途,這些系統和應用程式需要:

  1. 記憶體/運算受限的環境。
  2. 延遲受限情境。
  3. 推理與邏輯。

超出範圍的使用案例

這些模型並非專門為所有下游目的而設計或評估,因此

  1. 開發人員在選擇使用案例時,應考量語言模型的常見限制,並在使用於特定下游使用案例(特別是高風險情境)之前,評估並降低準確性、安全性和公平性風險。
  2. 開發人員應注意並遵守適用於其使用案例的相關法律或法規(包括隱私、貿易合規法律等),包括模型對英文的關注。
  3. 本 Readme 中包含的任何內容均不應被解釋或視為對模型發布所依據許可證的限制或修改。