LM Studio 入门教程|在 Silly Tavern 与 MiniTavern 中连接本地模型
LM Studio 是常见的桌面端本地大模型工具:在图形界面里搜索、下载 GGUF 模型,加载到本机运行,并通过 Local Server 提供 OpenAI 兼容 HTTP API(默认端口多为 1234)。本文说明 LM Studio 的用途、与 Ollama 的差异,以及在 Silly Tavern(PC)与 MiniTavern(手机)中的连接方式。
手机端逐步操作可对照官网教程:3.7 本地免费 AI:LM Studio。若你在 Silly Tavern 1.16+ 里找不到 LM Studio 入口,可先读 Ollama / LM Studio 三步找入口。
LM Studio 是什么?
LM Studio 面向 Windows、macOS、Linux,主要能力包括:
- 浏览并下载社区 GGUF 模型;
- 在本机加载模型并对话测试;
- 开启 Local Server,让 Silly Tavern、MiniTavern 等前端通过 HTTP 调用推理。
对角色扮演场景来说,LM Studio 负责「在本机跑模型」,角色卡与对话界面仍由 Silly Tavern 或 MiniTavern 管理。
LM Studio 和 Ollama 怎么选?
两者都能跑本地模型,接入路径不同:
| 对比项 | LM Studio | Ollama |
|---|---|---|
| 操作方式 | 图形界面为主 | 命令行 / 轻量服务为主 |
| Silly Tavern | Text Completion → Generic (OpenAI-compatible) | Text Completion → Ollama |
| 典型本机地址 | http://127.0.0.1:1234 | http://127.0.0.1:11434 |
| MiniTavern URL 示例 | http://192.168.x.x:1234/v1 | http://192.168.x.x:11434/api |
| 官方教程 | 3.7 LM Studio | 3.6 Ollama |
角色扮演建议优先选 7B 及以上参数量;过小模型容易漏系统提示或格式混乱(可参考本站 Ollama 小模型实测)。
在电脑上准备 LM Studio
安装与下载模型
- 从 lmstudio.ai 安装并打开 LM Studio;
- 在 Discover(模型库)中下载一个指令模型,例如 Qwen2.5-7B-Instruct 的 GGUF 量化版;
- 在 Chat 或加载界面将模型 Load 到内存/显存。
启动 Local Server
- 打开 Developer → Local Server(菜单名称因版本可能略有不同);
- 点击 Start server,确认地址(常见为
http://127.0.0.1:1234); - 终端自测:
curl http://127.0.0.1:1234/v1/models若返回 JSON 模型列表,说明服务已就绪。
手机访问时额外步骤
MiniTavern 在手机上使用时,还需:
- 在 Local Server 设置中开启 Allow connections from network(允许局域网连接);
- 将
127.0.0.1换成电脑的局域网 IP(如192.168.1.2); - 确保手机与电脑在同一 Wi-Fi。
在 Silly Tavern 中连接 LM Studio
Silly Tavern 1.16 起,LM Studio 不在顶层单独占一项,需走 Text Completion 下的 OpenAI 兼容类型。
配置步骤
- 点击顶部 API Connections(插头图标);
- 主 API(main_api)选 Text Completion,不要选 Chat Completion;
- API Type 选 Generic (OpenAI-compatible) [LM Studio, LiteLLM, etc.];
- Server URL 填
http://127.0.0.1:1234(是否需在末尾加/v1以 Connect 测试为准); - API Key 本地可留空,或填
lm-studio; - 点击 Connect,在模型列表中选择 LM Studio 当前加载的模型,保存后开始对话。
Silly Tavern 配置示例
| 设置项 | 示例值 |
|---|---|
| 主 API | Text Completion |
| API Type | Generic (OpenAI-compatible) |
| Server URL | http://127.0.0.1:1234 |
| API Key | 留空或 lm-studio |
对话示例
- 导入任意 Silly Tavern 角色卡;
- 用户首句:「请用一句话介绍你扮演的角色。」;
- 若配置正确,应收到符合角色设定的回复,而不是 HTTP 错误或空白输出。
常见遗漏:误选 Chat Completion,或 LM Studio 未启动 Local Server。
在 MiniTavern 中连接 LM Studio
MiniTavern 通过 Other LLM(其他 LLM)连接 OpenAI 兼容接口。与 Ollama 共用同一入口,但 URL 格式不同。
配置要点
- 电脑端 LM Studio Local Server 已运行,且已允许局域网访问(若手机与电脑不在同一设备);
- MiniTavern → 设置 → LLM 设置 → AI 服务商 → 选择其他;
- LLM URL 填:
http://你的电脑IP:1234/v1(例如http://192.168.1.2:1234/v1); - API Key 填
lm-studio或任意占位; - 获取模型列表 → 选择当前模型 → 测试连接 → 保存。
勿与 Ollama 混用 URL
Ollama 在 MiniTavern 中常用 http://IP:11434/api;LM Studio 须用 1234 端口且路径为 /v1。
分步图文见 官方教程 3.7 LM Studio。移动端入门另可参考 在手机上玩 Silly Tavern|MiniTavern 入门。
常见问题与排错
- Connect 无反应:检查 Silly Tavern 是否选了 Text Completion;LM Studio 是否已 Load 模型并 Start server。
- MiniTavern 模型列表为空:确认 URL 含
/v1;在电脑浏览器访问http://127.0.0.1:1234/v1/models是否有返回。 - 手机连不上:检查局域网开关、IP、防火墙对 1234 端口的放行,以及是否同一 Wi-Fi。
- 回复质量差:换更大模型或更高量化档位,并调整上下文长度。
参考链接
关于作者
常见问题(FAQ)
LM Studio 一定要联网吗?
下载模型时需要网络;模型已下载且 Local Server 运行后,本地推理可离线进行(除非模型或功能本身依赖在线组件)。
能否 Silly Tavern 和 MiniTavern 同时连同一台 LM Studio?
可以,但并发会增加显存与 CPU/GPU 压力,可能出现变慢或排队。一般家庭使用同时开一端对话更稳。
为什么 Silly Tavern 里不能选 Ollama 类型连 LM Studio?
Ollama 使用自有 API 格式;LM Studio Local Server 提供的是 OpenAI 兼容接口。在 Silly Tavern 中应使用 Generic (OpenAI-compatible),在 MiniTavern 中使用 Other LLM 并填写 /v1 URL。
发布日期:2026 年 6 月 5 日
最后更新:2026 年 6 月 5 日
