更新於 5 個月前
5 個月前
74690ad307cb · 4.1GB
模型
架構internlm2
·
參數7.74B
·
量化Q3_K_L
4.1GB
參數
{ "stop": [ "<|eot_id|>" ], "temperature": 0 }
50B
系統
Determine whether the provided claim is consistent with the corresponding document. Consistency in t
340B
範本
{{- if .Messages }} {{- range $i, $_ := .Messages }} {{- $last := eq (len (slice $.Messages $i)) 1 -
506B
說明文件
這是一個由 Bespoke Labs 開發的基於事實根據的事實查核模型。
這個模型接受一個文件(文字)和一個句子作為輸入,並判斷該句子是否被該文件所支持。為了查核一個多句子的聲明,該聲明應首先被分解成句子。除非文件超過 32K tokens,否則不需要將文件分塊。
Bespoke-MiniCheck 是最先進的事實查核模型,儘管它體積小巧。
使用方式
提示範本如下:
Document: {document}
Claim: {claim}
回應將會是 Yes
或 No
。
範例
提示
Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are preparing for an examination.
回應
Yes
提示
Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are on vacation.
回應
No
模型效能
這些模型的效能在我們新收集的基準測試 (在訓練期間模型未見過) LLM-AggreFact 上進行評估,該基準測試來自 11 個最近人工標註的關於事實查核和 grounding LLM 生成的數據集。 Bespoke-MiniCheck-7B 是最先進的事實查核模型,儘管它體積小巧。