Silly Tavern 接入硅基流動(SiliconFlow):對話 + 嵌入,Global / China 怎麼選
個人向點評:我把它當成「給 Silly Tavern 用的、帶國內線路的 OpenAI 兼容 API 商」來理解——你不是在哪家 App 裏鎖死聊天,而是 自己端着 ST,選一個 模型池相對清晰、中文又可用 的供應商。硅基流動(SiliconFlow)在國內創作者圈裏曝光不低;Silly Tavern 官方在 1.17.0 裏原生掛上 SiliconFlow,在我看來主要是三點:
① 大陸用戶連得上、可選 Global/China; ② 對話 + 嵌入(embedding)一條密鑰打通,做世界書向量省事; ③ 模型列表偏「開源/國產大模型聚合」,和只會開 OpenAI 官方一條路相比,調模型成本更直觀。
SiliconFlow(硅基流動) 提供 OpenAI 兼容的推理與嵌入接口,模型池裏常見國產與開源大模型,對中文場景較友好。Silly Tavern 自 1.17.0 起,在 Chat Completion(聊天補全) 裏可直接選 SiliconFlow 作爲來源,並在 向量存儲(Vectors)擴展 裏使用 SiliconFlow 嵌入,便於世界書 / 記憶向量化(RAG 一類玩法)。
更實用的一點:客戶端裏 SiliconFlow Endpoint 可以選 Global (api.siliconflow.com) 或 China (api.siliconflow.cn)——在中國大陸網絡環境下,很多人的體驗是 國內線路更穩定;在海外或已有 Global 賬號則常用 .com。對話和嵌入共用你在 API 連接裏填的密鑰與同一套 endpoint 選擇(嵌入請求會跟着當前 siliconflow_endpoint 走),無需記兩套地址邏輯。
官網實測:登錄後隨手截的圖(非 ST 界面)
下面三張是編者 註冊並登錄 SiliconFlow 官網/控制檯後 瀏覽時的界面截圖,與 Silly Tavern 客戶端不是同一個產品界面——只是爲了幫你對「平臺上長什麼樣、模型大概怎麼列」有個直觀印象;實際可用模型與價格以官網與控制檯爲準。
![]()
官網首頁/品牌區一類的橫幅區域(截圖時分辨率與主題以當時頁面爲準)。
![]()
模型列表節選:你在 ST 裏選擇 SiliconFlow Model 時,名稱需與平臺/API 文檔中一致;列表會隨上架變動。
![]()
上圖爲 MiniMax-M2.5 在 SiliconFlow 上的展示節選。關於該模型的定位、能力宣發與計費說明,以官方爲準;可一併閱讀硅基流動的官方博文:MiniMax M2.5 Now on SiliconFlow: Built For Real-World Productivity。在 Silly Tavern 裏若選用該模型,請在 SiliconFlow Model 中選取與 API 一致的模型 ID(例如文檔中出現的 MiniMaxAI/MiniMax-M2.5 等形式,以你當前控制檯與 API 文檔 爲準)。
你需要提前準備什麼
- Silly Tavern 升級至 1.17.0 或更高(舊版沒有 SiliconFlow 入口)。官方說明 Release 1.17.0 註明環境要求爲 Node.js 20+,請一併檢查。
- 到 硅基流動 / SiliconFlow(或國際站 .siliconflow.com,以官網爲準)註冊並創建 API Key。
- 確認 計費與速率限制 以官方控制檯爲準——本文不寫價格。
第一步:聊天(Chat Completion)接入 SiliconFlow
- 點擊頂部 API 連接(插頭圖標),將 主 API 設爲 Chat Completion(聊天補全)。
- 在 API 或數據源 下拉框中選擇 SiliconFlow(與 OpenAI、DeepSeek 等並列的那一欄)。
- 填寫 SiliconFlow API Key;點 Connect / 連接(連接後密鑰可能按隱私策略隱藏,屬正常行爲)。
- 在 SiliconFlow Endpoint 中選擇一項:
- Global (siliconflow.com) →
https://api.siliconflow.com/v1 - China (siliconflow.cn) →
https://api.siliconflow.cn/v1
- Global (siliconflow.com) →
- 在 SiliconFlow Model 中選擇你要用的 對話模型,再正常聊天即可。
若列表拉取失敗,多半是 密鑰錯誤、endpoint 與賬號區域不一致、或網絡無法訪問所選域名——可先切換 Global/China 試一下,並對照官網當前 API 文檔。
和 Ollama 的區別:Ollama 在 ST 裏走 Text Completion + API Type Ollama;SiliconFlow 走的是 Chat Completion 裏的 SiliconFlow,不要混到「文本補完」那條鏈路裏。
第二步(可選):用 SiliconFlow 做「向量嵌入 / Embedding」
若你啓用了 ST 的 向量(Vectors)擴展,可以把「向量化後端」選成 SiliconFlow:
- API Key:與聊天區 共用——在 API 連接 裏爲 SiliconFlow 保存的密鑰即可;擴展裏會提示你在 API 連接中設置。
- Endpoint:向量請求會使用當前在聊天區選的
siliconflow_endpoint(global / cn),與對話線路一致。 - 模型:在擴展設置裏選擇 嵌入模型(列表由 ST 請求 SiliconFlow 的 embedding 模型接口拉取;若爲空,先檢查密鑰與線路)。
嵌入用於:例如把世界書條目、聊天記錄等編成向量,做檢索增強。不會做也沒關係,先只開對話也可。
SiliconFlow(硅基流動)和 OpenRouter 的異同
兩者在 Silly Tavern 裏都走 Chat Completion 路線:填 API Key、選模型、再聊天,上手路徑很像。差別主要在 商業模式與「你在買什麼」:
| 維度 | SiliconFlow(硅基流動) | OpenRouter |
|---|---|---|
| 定位 | 以 OpenAI 兼容接口 提供 其平臺可上架的推理/嵌入模型;可選 api.siliconflow.cn / .com | 多供應商路由:同一套 API 背後可接到各家模型與 region,更像「模型超市 + 路由」 |
| 網絡與賬單 | 顯式區分 Global / China 線路,適合你要把 API 出口「固定」在某一區域時心裏更有數 | 依賴具體模型與供應商,大陸訪問質量因模型而異;賬單單位常與 token/供應商組合掛鉤 |
| 在 ST 1.17 裏 | 原生 SiliconFlow + 嵌入 一條龍,endpoint 與嵌入共用 | ST 對 OpenRouter 還有 供應商篩選、推理轉發 等進階能力(見發行說明),玩法更「集郵」 |
| 怎麼選(很主觀) | 你主要玩中文、想一條線路 +\cn 兜底、並想在 ST 裏順便做嵌入 | 你明確要跨家模型對比、或依賴 OpenRouter 特有的模型/路由能力 |
沒有「誰碾壓誰」:OpenRouter 勝在廣,SiliconFlow 勝在 ST 內嵌直出 + 國內 endpoint 敘事清晰——最後仍看你的 模型名單、價格與延遲。
SiliconFlow(硅基流動)上是否有「破限」模型?
社區裏常說 「破限」,一般指 希望模型少拒絕、少套話、更適合成人向或重口味角色扮演 等主觀期待——並不是 SiliconFlow 或任何平臺上的正式技術分類,也沒有統一的「破限證書」。
在 硅基流動 上:
- 能選到哪些 基座模型、各模型默認安全策略如何,以 官網模型列表與用戶協議 爲準,而且會隨上架與政策調整。
- 同一張卡、同一套預設,在不同基座上表現差很大;是否滿足你對 「破限」 的想象,只能靠 自行試模 + 調整預設/世界書,本文不評價具體模型名。
- 合規底線:請遵守所在地法律與平臺規則。
參考鏈接
- Silly Tavern 1.17.0 Release(SiliconFlow 對話與嵌入、endpoint 選擇等)
- Silly Tavern 官方文檔
- 硅基流動 SiliconFlow(註冊、密鑰、計費以官網爲準)
- MiniMax M2.5 Now on SiliconFlow(官方博文)
- MiniTavern 官網
作者簡介
常見問題(FAQ)
Q1:爲什麼 SiliconFlow 不出現在「文本補全」裏?
SiliconFlow 在 ST 裏掛在 Chat Completion 下。本地 GGUF 等仍多用 Text Completion + Ollama/KoboldCpp。
Q2:連接成功但嵌入列表是空的?
檢查 API Key 是否對 嵌入接口 有權;endpoint 是否與賬號區域一致;網絡能否訪問 api.siliconflow.cn 或 .com。必要時查看瀏覽器 / ST 控制檯報錯。
Q3:想和 ST 裏其他預設(系統提示詞)一起用可以嗎?
可以。選定 SiliconFlow 模型後,正常配置 預設、角色卡、世界書 即可;流式與推理類開關視模型支持情況而定。
Q4:1.16 以前能用嗎?
1.17.0 起發行說明中才包含 SiliconFlow 對話與嵌入集成;舊版請升級 ST 與 Node 環境。
執筆日:2026 年 3 月 30 日
最後更新:2026 年 3 月 31 日
