Readme
這是一個由 Bespoke Labs 開發的 grounded factuality checking 模型。
此模型將文件(文字)和句子作為輸入,並判斷該句子是否受文件支持。為了 фактом-check 多句聲明,應首先將聲明分解為句子。除非文件超過 32K tokens,否則無需分塊。
Bespoke-MiniCheck 是 SOTA факт-checking 模型,儘管其尺寸很小。
使用方式
提示模板如下
Document: {document}
Claim: {claim}
回應將為 Yes
或 No
。
範例
提示
Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are preparing for an examination.
回應
Yes
提示
Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are on vacation.
回應
No
模型效能
這些模型的效能在我們新收集的基準(我們的模型在訓練期間未見過)LLM-AggreFact 上進行評估,該基準來自 11 個最近人工註釋的 факт-checking 和 grounded LLM 生成的資料集。Bespoke-MiniCheck-7B 是 SOTA факт-checking 模型,儘管其尺寸很小。