本地大模型测试工具
记录日期: 2026-05-01 环境: Windows, OpenClaw 工作区
1. vLLM Playground — 数据测试
定位: 偏向于测试数据、交互调试
启动命令:
vllm-playground --host localhost
特点:
- Web UI 界面,支持实时对话
- Benchmark 面板集成 GuideLLM
- 模型管理(拉取/切换)
- 可观测性(token 计数、延迟、吞吐)
- 中英双语
2. llm_speedtest — 图表趋势
定位: 偏向于性能基准测试、生成图表趋势
位置: 工作区 llm_speedtest
特点:
- 适合做多轮速度测试
- 输出图表,直观展示趋势
- 对比不同模型/参数的性能变化
使用场景区分
| 场景 | 推荐工具 |
|---|---|
| 交互式调试、prompt 测试 | vLLM Playground |
| 性能对比、趋势分析 | llm_speedtest |
| 快速验证模型输出 | vLLM Playground |
| 长期性能监控 | llm_speedtest |