由 Bespoke Labs 開發的最新 Fact-Checking 模型。

7b

22.7K 5 months ago

Readme

這是一個由 Bespoke Labs 開發的 grounded factuality checking 模型。

此模型將文件(文字)和句子作為輸入,並判斷該句子是否受文件支持。為了對多句聲明進行事實查核,應首先將聲明分解為句子。除非文件超過 32K 個 tokens,否則無需對文件進行分塊。

bespoke-minicheck-howitworks.png

儘管 Bespoke-MiniCheck 尺寸很小,但它仍是 SOTA 事實查核模型。

使用方式

提示範本如下

Document: {document}
Claim: {claim}

回應將為 YesNo

範例

提示

Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are preparing for an examination.

回應

Yes

提示

Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are on vacation.

回應

No

模型效能

performance.png

這些模型的效能在我們新收集的基準測試(我們的模型在訓練期間未見過)LLM-AggreFact 上進行評估,該基準測試來自 11 個最近人工註釋的關於事實查核和 grounding LLM 生成的資料集。儘管 Bespoke-MiniCheck-7B 尺寸很小,但它仍是 SOTA 事實查核模型。

參考文獻

網站

論文

LLM-AggreFact 排行榜