Skip to content

LM Studio 入门教程|在 Silly Tavern 与 MiniTavern 中连接本地模型

LM Studio 是常见的桌面端本地大模型工具:在图形界面里搜索、下载 GGUF 模型,加载到本机运行,并通过 Local Server 提供 OpenAI 兼容 HTTP API(默认端口多为 1234)。本文说明 LM Studio 的用途、与 Ollama 的差异,以及在 Silly Tavern(PC)与 MiniTavern(手机)中的连接方式。

手机端逐步操作可对照官网教程:3.7 本地免费 AI:LM Studio。若你在 Silly Tavern 1.16+ 里找不到 LM Studio 入口,可先读 Ollama / LM Studio 三步找入口


LM Studio 是什么?

LM Studio 面向 Windows、macOS、Linux,主要能力包括:

  • 浏览并下载社区 GGUF 模型;
  • 在本机加载模型并对话测试;
  • 开启 Local Server,让 Silly Tavern、MiniTavern 等前端通过 HTTP 调用推理。

对角色扮演场景来说,LM Studio 负责「在本机跑模型」,角色卡与对话界面仍由 Silly Tavern 或 MiniTavern 管理。


LM Studio 和 Ollama 怎么选?

两者都能跑本地模型,接入路径不同:

对比项LM StudioOllama
操作方式图形界面为主命令行 / 轻量服务为主
Silly TavernText Completion → Generic (OpenAI-compatible)Text Completion → Ollama
典型本机地址http://127.0.0.1:1234http://127.0.0.1:11434
MiniTavern URL 示例http://192.168.x.x:1234/v1http://192.168.x.x:11434/api
官方教程3.7 LM Studio3.6 Ollama

角色扮演建议优先选 7B 及以上参数量;过小模型容易漏系统提示或格式混乱(可参考本站 Ollama 小模型实测)。


在电脑上准备 LM Studio

安装与下载模型

  1. lmstudio.ai 安装并打开 LM Studio;
  2. 在 Discover(模型库)中下载一个指令模型,例如 Qwen2.5-7B-Instruct 的 GGUF 量化版;
  3. 在 Chat 或加载界面将模型 Load 到内存/显存。

启动 Local Server

  1. 打开 Developer → Local Server(菜单名称因版本可能略有不同);
  2. 点击 Start server,确认地址(常见为 http://127.0.0.1:1234);
  3. 终端自测:
bash
curl http://127.0.0.1:1234/v1/models

若返回 JSON 模型列表,说明服务已就绪。

手机访问时额外步骤

MiniTavern 在手机上使用时,还需:

  • 在 Local Server 设置中开启 Allow connections from network(允许局域网连接);
  • 127.0.0.1 换成电脑的局域网 IP(如 192.168.1.2);
  • 确保手机与电脑在同一 Wi-Fi。

在 Silly Tavern 中连接 LM Studio

Silly Tavern 1.16 起,LM Studio 不在顶层单独占一项,需走 Text Completion 下的 OpenAI 兼容类型。

配置步骤

  1. 点击顶部 API Connections(插头图标);
  2. 主 API(main_api)选 Text Completion,不要选 Chat Completion;
  3. API Type 选 Generic (OpenAI-compatible) [LM Studio, LiteLLM, etc.];
  4. Server URL 填 http://127.0.0.1:1234(是否需在末尾加 /v1 以 Connect 测试为准);
  5. API Key 本地可留空,或填 lm-studio
  6. 点击 Connect,在模型列表中选择 LM Studio 当前加载的模型,保存后开始对话。

Silly Tavern 配置示例

设置项示例值
主 APIText Completion
API TypeGeneric (OpenAI-compatible)
Server URLhttp://127.0.0.1:1234
API Key留空或 lm-studio

对话示例

  • 导入任意 Silly Tavern 角色卡;
  • 用户首句:「请用一句话介绍你扮演的角色。」;
  • 若配置正确,应收到符合角色设定的回复,而不是 HTTP 错误或空白输出。

常见遗漏:误选 Chat Completion,或 LM Studio 未启动 Local Server。


在 MiniTavern 中连接 LM Studio

MiniTavern 通过 Other LLM(其他 LLM)连接 OpenAI 兼容接口。与 Ollama 共用同一入口,但 URL 格式不同。

配置要点

  1. 电脑端 LM Studio Local Server 已运行,且已允许局域网访问(若手机与电脑不在同一设备);
  2. MiniTavern → 设置 → LLM 设置 → AI 服务商 → 选择其他;
  3. LLM URL 填:http://你的电脑IP:1234/v1(例如 http://192.168.1.2:1234/v1);
  4. API Key 填 lm-studio 或任意占位;
  5. 获取模型列表 → 选择当前模型 → 测试连接 → 保存。

勿与 Ollama 混用 URL

Ollama 在 MiniTavern 中常用 http://IP:11434/api;LM Studio 须用 1234 端口且路径为 /v1

分步图文见 官方教程 3.7 LM Studio。移动端入门另可参考 在手机上玩 Silly Tavern|MiniTavern 入门


常见问题与排错

  • Connect 无反应:检查 Silly Tavern 是否选了 Text Completion;LM Studio 是否已 Load 模型并 Start server。
  • MiniTavern 模型列表为空:确认 URL 含 /v1;在电脑浏览器访问 http://127.0.0.1:1234/v1/models 是否有返回。
  • 手机连不上:检查局域网开关、IP、防火墙对 1234 端口的放行,以及是否同一 Wi-Fi。
  • 回复质量差:换更大模型或更高量化档位,并调整上下文长度。

参考链接


关于作者

花

花(Hana)

AI工具評価の専門家。東京・新宿三丁目周辺で活動し、最新のAIアプリケーションやツールを実際に使用してレビューを提供しています。


常见问题(FAQ)

LM Studio 一定要联网吗?

下载模型时需要网络;模型已下载且 Local Server 运行后,本地推理可离线进行(除非模型或功能本身依赖在线组件)。

能否 Silly Tavern 和 MiniTavern 同时连同一台 LM Studio?

可以,但并发会增加显存与 CPU/GPU 压力,可能出现变慢或排队。一般家庭使用同时开一端对话更稳。

为什么 Silly Tavern 里不能选 Ollama 类型连 LM Studio?

Ollama 使用自有 API 格式;LM Studio Local Server 提供的是 OpenAI 兼容接口。在 Silly Tavern 中应使用 Generic (OpenAI-compatible),在 MiniTavern 中使用 Other LLM 并填写 /v1 URL。


发布日期:2026 年 6 月 5 日
最后更新:2026 年 6 月 5 日

最后更新: