更新於 5 個月前
5 個月前
560cfbea53dd · 3.8GB
model
archinternlm2
·
parameters7.74B
·
quantizationQ3_K_M
3.8GB
params
{ "stop": [ "<|eot_id|>" ], "temperature": 0 }
50B
system
Determine whether the provided claim is consistent with the corresponding document. Consistency in t
340B
template
{{- if .Messages }} {{- range $i, $_ := .Messages }} {{- $last := eq (len (slice $.Messages $i)) 1 -
506B
讀我檔案
這是一個由 Bespoke Labs 開發的基礎事實查核模型。
此模型接受文件(文字)和句子作為輸入,並判斷句子是否受文件支持。為了事實查核多句聲明,應首先將聲明分解為句子。除非文件超過 32K 個 tokens,否則無需分塊。
儘管 Bespoke-MiniCheck 尺寸小巧,但仍是最先進的事實查核模型。
使用方式
提示詞範本如下:
Document: {document}
Claim: {claim}
回應將為 Yes
或 No
。
範例
提示詞
Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are preparing for an examination.
回應
Yes
提示詞
Document: A group of students gather in the school library to study for their upcoming final exams.
Claim: The students are on vacation.
回應
No
模型效能
這些模型的效能是根據我們新收集的基準(我們的模型在訓練期間未見過)LLM-AggreFact 評估的,該基準來自 11 個關於事實查核和 grounding LLM 生成的最新人工註釋資料集。儘管 Bespoke-MiniCheck 尺寸小巧,但仍是最先進的事實查核模型。