Skip to content

Silly Tavern に SiliconFlow(シリコンフロー)を繋ぐ:対話+埋め込み、Global / China はどちらを使う?

個人的な位置づけ:これは Silly Tavern 向けに国内ルートも選べる OpenAI 互換 API プロバイダ だと理解しています。特定アプリにチャットをロックインするのではなく、自分で ST を持ちモデル一覧が分かりやすく、中国語利用にも向きやすい ところを選ぶイメージです。中国の創作コミュニティでは SiliconFlow の名前をよく見かけます。Silly Tavern が 1.17.0 で SiliconFlow をネイティブ対応した意味は、ざっくり次の3点だと感じています。

① 中国大陸からも繋ぎやすく、Global / China を選べる
② 対話と埋め込み(embedding)を同じ API Key で扱え、World Info などのベクトル化が楽
③ モデルはオープン/国産 LLM の寄せ集め傾向があり、OpenAI 公式だけ開くより 試すコスト感が分かりやすい

SiliconFlow(中国語表記:硅基流动) は OpenAI 互換の推論・埋め込み API を提供し、モデルプールには中国語に強いモデルも多く含まれます。Silly Tavern1.17.0 から Chat Completion(チャット補完)SiliconFlow をソースとして選べるようになり、Vectors(ベクトル)拡張 では SiliconFlow の埋め込み を使えます。World Info や記録のベクトル化、いわゆる RAG 系の遊び方にもつながります。

実務的には、クライアントの SiliconFlow EndpointGlobal(api.siliconflow.comChina(api.siliconflow.cn を切り替えられます。中国大陸のネットワークでは 国内(China)のほうが安定 という人が多く、海外や Global アカウント中心なら .com を使うことが多いです。対話も埋め込みも、API 接続で保存したキーと同じ endpoint 設定を共有します(埋め込みは現在の siliconflow_endpoint に追従)。2 系統の URL を覚え分ける負担はほぼありません


公式サイトを覗いてみたところ(ログイン後のスクリーンショット・ST ではない)

以下の 3 枚 は、編集者が SiliconFlow に登録しログインしたうえでダッシュボード/モデル周りを開いたときのスクショです。Silly Tavern の画面ではありません。モデル棚卸しのイメージ用。掲載モデル・価格・UI は公式とコンソールの最新表示に従ってください。

SiliconFlow(硅基流动)公式サイトの画面

トップ/ブランド帯まわりの一例(撮影時の解像度・テーマは当該ページに依存)。

SiliconFlow 上のモデル一覧(抜粋)

一覧の抜粋。ST の SiliconFlow Model では、ここや API ドキュメントと一致するモデル ID を選んでください。上架の変化で揺れます。

MiniMax M2.5 の SiliconFlow 上の紹介(抜粋)

MiniMax-M2.5 を SiliconFlow で紹介している画面の抜粋。性能・エージェント用途・料金の説明は 公式の告知を正 とし、詳しくは SiliconFlow のブログ記事 MiniMax M2.5 Now on SiliconFlow: Built For Real-World Productivity を参照してください。ST で使う場合は SiliconFlow Model から API と同じ表記のモデル(例:ドキュメントに出てくる MiniMaxAI/MiniMax-M2.5 形式など)を選び、SiliconFlow API ドキュメント とコンソールで再確認してください。


事前にそろえておくもの

  1. Silly Tavern1.17.0 以降 に更新(それより前には SiliconFlow 入口がありません)。リリースノート 1.17.0 では Node.js 20+ が要件なので合わせて確認してください。
  2. SiliconFlow(または国際側 siliconflow.com、最新は公式に準拠)で登録し、API Key を発行する。
  3. 課金とレート制限 はコンソールの表示を正とする——本稿では価格は扱いません。

ステップ1:チャット(Chat Completion)で SiliconFlow を使う

  1. 画面上部の API 接続(プラグアイコン) を開き、メイン APIChat Completion(チャット補完) にする。
  2. API またはデータソース のドロップダウンから SiliconFlow を選ぶ(OpenAI や DeepSeek などと並んだ項目)。
  3. SiliconFlow API Key を入力し、Connect / 接続 を押す(接続後、キーがマスクされるのはプライバシー上よくある挙動です)。
  4. SiliconFlow Endpoint で次のどちらかを選ぶ:
    • Global (siliconflow.com)https://api.siliconflow.com/v1
    • China (siliconflow.cn)https://api.siliconflow.cn/v1
  5. SiliconFlow Model で使う 対話モデル を選び、通常どおりチャットする。

一覧が取得できない場合は、キー誤り・endpoint とアカウントのリージョンの不一致・選択したドメインへの到達不可 が多いです。Global / China を切り替えて試し、公式の最新 API ドキュメントと照らしてください。

Ollama との違い:Ollama は ST では Text Completion + API Type Ollama 側です。SiliconFlow は Chat Completion 内の SiliconFlow なので、「テキスト補完」のほうに取りに行かないようにしてください。


ステップ2(任意):SiliconFlow で「ベクトル埋め込み/Embedding」

ST の Vectors 拡張 を有効にしている場合、ベクトル化バックエンドに SiliconFlow を選べます。

  • API Key:チャット側と 共通——API 接続 で SiliconFlow に保存したキーで足ります。拡張画面でも API 接続への案内が出ます。
  • Endpoint:ベクトル API も、チャットで選んでいる siliconflow_endpoint(global / cn) に合わせて送られます。
  • モデル:拡張の設定で 埋め込みモデル を選びます(一覧は ST が SiliconFlow の embedding API から取得。空ならキーとルートを再確認)。

埋め込みは、World Info エントリやチャット履歴などをベクトル化して検索強化する用途です。まずは対話だけでも問題ありません。


SiliconFlow と OpenRouter の違い(ざっくり)

どちらも Silly Tavern では Chat Completion 系:API Key → モデル選択 → チャット の流れが似ています。違いは主に ビジネスモデルと「何を買っているか」 です。

観点SiliconFlow(硅基流动)OpenRouter
位置づけOpenAI 互換で、自プラットフォーム上の推論/埋め込みモデルを提供。api.siliconflow.cn / .com を明示マルチベンダールーティング。背後に複数プロバイダ/リージョン。モデル量販店+ルータ に近い
ネットと請求Global / China をはっきり分けAPI 出口をどちらに固定するかが把握しやすいモデル・ベンダーごとに大陸からの品質がバラつくことがある。請求は token/ベンダー組み合わせで分かりにくいことも
ST 1.17SiliconFlow+埋め込み がネイティブ一体、endpoint も共有OpenRouter 向けに ベンダー絞り込みや推論プロキシ など、上級機能がリリースノートに載ることが多い
どう選ぶか(主観)中国語メインで一本の線+.cn も試したい/ST 内で埋め込みまで済ませたい色々なモデルを横断で比べたい/OpenRouter 特有事由がある

どちらが「絶対上」ではありません。広さは OpenRouter、ST 直結+国内 endpoint の話の分かりやすさは SiliconFlow——最後は モデル表・価格・遅延 で決まります。


SiliconFlow に「破限」モデルはあるのか?

コミュニティ語の 「破限(ポーシェン)」 は、拒否やテンプレ返答を減らし、アダルト寄りやハードなロールプレイに振りたい といった主観的な期待を指すことが多く、SiliconFlow や任意プラットフォームの公式カテゴリではありません公的な「破限認定」も存在しません

硅基流动 上では:

  • どの ベースモデル が選べるか、デフォルトの安全ポリシーがどうかは 公式のモデル一覧と利用規約 に従い、上架やポリシーで変わります。
  • 同じキャラカードや同じプリセットでも、ベースが違えば挙動は大きく変わります。「破限」という言葉に自分の想像が合うかは、試行とプリセット/World Info 調整次第で、本稿ではモデル名の評価はしません。
  • 法令とプラットフォームのルールを守るのは利用者の責任です。

参考リンク


著者について

花

花(Hana)

AI工具評価の専門家。東京・新宿三丁目周辺で活動し、最新のAIアプリケーションやツールを実際に使用してレビューを提供しています。


よくある質問(FAQ)

Q1:なぜ SiliconFlow は「テキスト補完」に出てこない?

SiliconFlow は Chat Completion 側にぶら下がっています。ローカル GGUF などは引き続き Text Completion + Ollama/KoboldCpp が主なルートです。

Q2:接続は成功するが埋め込みのリストが空?

API Key に埋め込み API の権限があるか、endpoint がアカウントのリージョンと一致しているか、ネットワークが api.siliconflow.cn または .com に届くかを確認してください。ブラウザや ST のコンソールエラーも参照するとよいです。

Q3:他のプリセット(システムプロンプト)と一緒に使える?

はい。SiliconFlow のモデルを選んだうえで、プリセット・キャラカード・World Info は通常どおり設定できます。ストリーミングや推論系のトグルはモデル対応次第です。

Q4:1.16 以前でも使える?

1.17.0 のリリースノートで SiliconFlow の対話・埋め込み連携が入っています。それ以前は ST と Node 環境をアップグレードしてください。


執筆日:2026 年 3 月 30 日
最終更新:2026 年 3 月 31 日


最終更新: