Silly Tavern × SiliconFlow: чат, эмбеддинги, Global / China
SiliconFlow даёт OpenAI-совместимые инференс и embedding; в пуле часто открытые и китайские модели, удобно для китайского сценария. Silly Tavern 1.17.0+ добавляет источник SiliconFlow в Chat Completion и поддержку SiliconFlow в расширении Vectors — один ключ и выбор Global (api.siliconflow.com) или China (api.siliconflow.cn) для обоих.
Важно: SiliconFlow в ST идёт по ветке Chat Completion, не путать с Text Completion → Ollama.
Скриншоты сайта (не интерфейс ST)
Регистрация и список моделей на siliconflow.cn / .com — ориентир, как выглядит платформа.
![]()
![]()
![]()
Про модель см. официальный пост SiliconFlow и API docs.
Перед настройкой
- Silly Tavern ≥ 1.17.0, Node.js 20+ (см. релиз).
- Регистрация и API Key на сайте SiliconFlow.
- Цены и лимиты — только в консоли провайдера.
Шаг 1: Chat Completion → SiliconFlow
- API Connections → главный API: Chat Completion.
- Источник данных: SiliconFlow.
- Вставьте API Key, Connect.
- SiliconFlow Endpoint:
- Global →
https://api.siliconflow.com/v1 - China →
https://api.siliconflow.cn/v1
- Global →
- SiliconFlow Model — модель для чата.
Ошибки чаще всего: неверный ключ, несовпадение региона аккаунта и endpoint, сеть до выбранного домена.
Шаг 2 (опция): эмбеддинги в Vectors
В расширении векторов выберите бэкенд SiliconFlow:
- Ключ тот же, что в Chat Completion.
- Endpoint совпадает с
siliconflow_endpointв чате. - Модель эмбеддинга — из списка ST; пусто → проверьте ключ и линию.
Для RAG по лору и истории; можно пользоваться только чатом.
SiliconFlow и OpenRouter
Оба в ST идут через Chat Completion. OpenRouter — маршрутизация многих провайдеров; SiliconFlow — платформа с явным CN/Global и встроенным embedding в ST 1.17. Выбор за вашим списком моделей, ценой и задержкой.
«Uncensor» / «без фильтра»
Разговорный ярлык; не официальная категория платформы. Политики моделей читайте в ToS и на сайте; соблюдайте законы региона.
Ссылки
Об авторе
FAQ
Почему нет SiliconFlow в Text Completion?
Он привязан к Chat Completion; локальные GGUF чаще через Text Completion + Ollama/KoboldCpp.
Подключилось, список эмбеддингов пуст?
Права ключа, регион endpoint, сеть, логи ST/браузера.
Совместимо с пресетами и лором?
Да; стриминг и параметры зависят от модели.
Работает ли в < 1.17?
Интеграция в релизе 1.17.0; обновите ST и Node.
Опубликовано: 31 марта 2026
Обновлено: 31 марта 2026
