由 Bespoke Labs 開發的先進事實查核模型。

7b

22.7K 5 個月前

Readme

這是一個由 Bespoke Labs 開發的基於事實的真實性檢查模型。

該模型接收文件(文本)和句子作為輸入,並確定該句子是否受文件支持。為了事實查核多句聲明,應首先將聲明分解為句子。除非文件超過 32K 個 tokens,否則不需要將文件分塊。

bespoke-minicheck-howitworks.png

儘管 Bespoke-MiniCheck 體積小巧,但它是 SOTA 事實查核模型。

Usage

提示範本如下

Document: {document}
Claim: {claim}

回應將為 YesNo

Examples

Prompt

Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are preparing for an examination.

Response

Yes

Prompt

Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are on vacation.

Response

No

Model performance

performance.png

這些模型的效能是在我們新收集的基準(我們的模型在訓練期間未見過)LLM-AggreFact 上評估的,該基準來自 11 個最近的人工註釋資料集,關於事實查核和 grounding LLM 生成。儘管 Bespoke-MiniCheck-7B 體積小巧,但它是 SOTA 事實查核模型。

References

Website

Paper

LLM-AggreFact Leaderboard