reflection:70b-q4_0 - Ollama 框架

reflection

一個高效能模型，採用名為「Reflection-tuning」（反思調校）的新技術訓練，教導 LLM 偵測其推理中的錯誤並修正方向。

70b

103.4K 提取次數更新於 6 個月前

更新於 6 個月前

6 個月前

5084e77c1e10 · 40GB

{ "stop": [ "<|start_header_id|>", "<|end_header_id|>", "<|eot_id|>"

{{- range $i, $_ := .Messages }}<|start_header_id|>{{ .Role }}<|end_header_id|> {{ .Content }} {{- i

您是一個世界級的 AI 系統，能夠進行複雜的推理和反思。請針對問題進行推理

LLAMA 3.1 社群授權協議 Llama 3.1 版本發布日期：2024 年 7 月 23 日「協議」

讀我檔案

在取樣期間，模型會先在 <thinking> 和 </thinking> 標籤內輸出推理過程，然後一旦對其推理感到滿意，就會在 <output> 和 </output> 標籤內輸出最終答案。每個標籤都是特殊 token，已訓練到模型中。

這使模型能夠將其內部想法和推理與最終答案分開，從而改善使用者體驗。

在 <thinking> 區段內，模型可能會輸出一個或多個 <reflection> 標籤，這表示模型已發現其推理中的錯誤，並將嘗試在提供最終答案之前更正它。

參考文獻