Skip to content

Silly Tavern × SiliconFlow: чат, эмбеддинги, Global / China

SiliconFlow даёт OpenAI-совместимые инференс и embedding; в пуле часто открытые и китайские модели, удобно для китайского сценария. Silly Tavern 1.17.0+ добавляет источник SiliconFlow в Chat Completion и поддержку SiliconFlow в расширении Vectors — один ключ и выбор Global (api.siliconflow.com) или China (api.siliconflow.cn) для обоих.

Важно: SiliconFlow в ST идёт по ветке Chat Completion, не путать с Text Completion → Ollama.


Скриншоты сайта (не интерфейс ST)

Регистрация и список моделей на siliconflow.cn / .com — ориентир, как выглядит платформа.

Баннер сайта SiliconFlow

Фрагмент списка моделей

MiniMax на SiliconFlow

Про модель см. официальный пост SiliconFlow и API docs.


Перед настройкой

  1. Silly Tavern ≥ 1.17.0, Node.js 20+ (см. релиз).
  2. Регистрация и API Key на сайте SiliconFlow.
  3. Цены и лимиты — только в консоли провайдера.

Шаг 1: Chat Completion → SiliconFlow

  1. API Connections → главный API: Chat Completion.
  2. Источник данных: SiliconFlow.
  3. Вставьте API Key, Connect.
  4. SiliconFlow Endpoint:
    • Global → https://api.siliconflow.com/v1
    • China → https://api.siliconflow.cn/v1
  5. SiliconFlow Model — модель для чата.

Ошибки чаще всего: неверный ключ, несовпадение региона аккаунта и endpoint, сеть до выбранного домена.


Шаг 2 (опция): эмбеддинги в Vectors

В расширении векторов выберите бэкенд SiliconFlow:

  • Ключ тот же, что в Chat Completion.
  • Endpoint совпадает с siliconflow_endpoint в чате.
  • Модель эмбеддинга — из списка ST; пусто → проверьте ключ и линию.

Для RAG по лору и истории; можно пользоваться только чатом.


SiliconFlow и OpenRouter

Оба в ST идут через Chat Completion. OpenRouter — маршрутизация многих провайдеров; SiliconFlow — платформа с явным CN/Global и встроенным embedding в ST 1.17. Выбор за вашим списком моделей, ценой и задержкой.


«Uncensor» / «без фильтра»

Разговорный ярлык; не официальная категория платформы. Политики моделей читайте в ToS и на сайте; соблюдайте законы региона.


Ссылки


Об авторе

花

花(Hana)

AI工具評価の専門家。東京・新宿三丁目周辺で活動し、最新のAIアプリケーションやツールを実際に使用してレビューを提供しています。


FAQ

Почему нет SiliconFlow в Text Completion?

Он привязан к Chat Completion; локальные GGUF чаще через Text Completion + Ollama/KoboldCpp.

Подключилось, список эмбеддингов пуст?

Права ключа, регион endpoint, сеть, логи ST/браузера.

Совместимо с пресетами и лором?

Да; стриминг и параметры зависят от модели.

Работает ли в < 1.17?

Интеграция в релизе 1.17.0; обновите ST и Node.


Опубликовано: 31 марта 2026
Обновлено: 31 марта 2026


Обновлено: