本地大模型测试工具

2026-05-10 · 1 min · 233 words · 新人类

Table of Contents

本地大模型测试工具

记录日期: 2026-05-01 环境: Windows, OpenClaw 工作区

1. vLLM Playground — 数据测试

定位: 偏向于测试数据、交互调试

启动命令:

vllm-playground --host localhost

特点:

Web UI 界面，支持实时对话
Benchmark 面板集成 GuideLLM
模型管理（拉取/切换）
可观测性（token 计数、延迟、吞吐）
中英双语

2. llm_speedtest — 图表趋势

定位: 偏向于性能基准测试、生成图表趋势

位置: 工作区 llm_speedtest

特点:

适合做多轮速度测试
输出图表，直观展示趋势
对比不同模型/参数的性能变化

使用场景区分

场景	推荐工具
交互式调试、prompt 测试	vLLM Playground
性能对比、趋势分析	llm_speedtest
快速验证模型输出	vLLM Playground
长期性能监控	llm_speedtest