一句话: 让 AI 写测试用例,顺序是死的:先让它复述需求,复述对了再定测试维度,最后才生成用例。用例条数不代表覆盖,验收只看一件事——异常流、边界、权限这些"不舒服的路径"占了多少。
测试用例最怕只测"能不能正常用"。真实用户不会按理想路径走:他会重复点击、漏填字段、传错文件、网络断在一半、在你没适配的手机上打开页面。
AI 补测试场景很快,但它默认也只想得到阳光路径。你要逼它从风险角度思考。
先理解需求
直接贴需求要用例,是新手最常见的翻车方式。AI 对需求的理解偏一点,后面几十条用例全部白写。
下面是产品需求。请先复述这个功能的目标、用户流程和关键规则。 然后指出哪些地方可能影响测试范围。 需求如下:[粘贴需求]
盯它的复述:漏掉的规则、说含糊的分支,就是将来的漏测点。复述不准就先补需求信息,别往下走。它顺手指出的"需求没写清楚的地方",往往比用例本身值钱——拿去问产品,能提前消灭一批扯皮。
设计测试维度
请为这个功能设计测试维度。 包括:正常流程、异常流程、权限、边界值、兼容性、性能、数据一致性、回归影响。
先定维度再写用例,是为了防"想到哪写到哪"。对照这张表检查它的输出:
| 维度 | AI 默认会写 | AI 容易漏 |
|---|---|---|
| 异常流程 | 输入为空、格式错误 | 操作中断后恢复、弱网重试、重复提交 |
| 边界值 | 最大最小值 | 你们库里字段的真实长度限制、枚举值 |
| 权限 | 未登录访问 | 平级越权:A 用户改 B 用户的数据 |
| 数据一致性 | 单表校验 | 跨系统对账、异步任务失败后的脏数据 |
| 回归影响 | 本功能自身回归 | 共用组件改动牵连的旧功能 |
右边那一列,就是你比 AI 值钱的地方。
生成测试用例
请基于这个需求生成测试用例。 每条用例包含:用例名称、前置条件、操作步骤、预期结果、优先级。 不要只覆盖成功路径,要重点补异常和边界场景。
拿到用例先去重:AI 很喜欢把同一条用例换个措辞写三遍凑数量。再逐条查"预期结果"——它写的预期可能是它猜的需求,和 PRD 对不上的当场改掉,不然测试通过也是假的。
上线前风险检查
请从上线风险角度检查这个功能。 输出:必须测试、建议测试、可延后测试。 重点关注数据丢失、权限绕过、重复提交、接口失败和移动端问题。
测试时间永远不够,这一步的产出就是砍用例的依据:必须测的保住,可延后的写进风险备忘,别不明不白地漏掉。让它顺便给每条标一句"这条不测,最坏会发生什么"——这句话拿去和产品争测试时间,比"覆盖率不够"管用。
自动化测试怎么考虑
请判断这些测试用例哪些适合自动化。 说明原因、优先级和自动化前需要准备的数据。
口径很简单:高频回归、流程稳定、断言明确的才自动化。UI 还在每周改的功能别急着写脚本,维护成本会吃掉全部收益。数据准备是自动化里最容易被低估的部分:测试账号、初始数据、跑完后的清理,让 AI 把这些一起列出来,别等脚本写完才发现没数据可跑。
顺手让 AI 写缺陷报告
测出问题后,别只在群里发一句"支付页面崩了"。把现象贴给 AI:
我发现一个缺陷,现象是:[现象]。操作路径:[路径]。环境:[环境/账号类型]。 请整理成标准缺陷报告:标题、复现步骤、预期结果、实际结果、严重程度建议。
复现步骤它写得又快又规整,开发不用追着你问"怎么复现"。但严重程度只能当建议——影响范围和业务优先级它没有上下文,定级还是你来。
坑与红线
- 覆盖率假象:用例多不等于覆盖广。按维度抽查,正常路径占比超过一半就要警惕。
- AI 不知道你的真实数据约束。用例里的测试数据(手机号、金额、长度)要换成你们系统的真实边界。
- 带客户真实数据的 bug 单、生产库导出,脱敏之前不进对话框。
- AI 生成的用例没人逐条读过就入库,等于没有用例——它的错会以用例的形式固化下来。
- 测试环境的地址、账号密码别写进让 AI 整理的用例文档,再被同步到外部工具。泄露往往不是被黑,是自己同步出去的。
Glouth 怎么用
写测试计划、补边界用例,用 Glouth Chat 就够。要把用例生成接进测试平台或流水线,走 Glouth Link 的 OpenAI 兼容接口,改一行 base_url 即可,接入细节看 API 接入指南。
FAQ
Q:一个功能多少条用例算合适? 没有标准数。看维度覆盖:八个维度每个都有用例、异常和边界占一半以上,比堆 200 条阳光用例靠谱得多。
Q:需求文档很烂,AI 还能用吗? 能,而且更要用。先让它复述并列出"需求没说清的问题",拿这份清单去找产品补齐,比直接开测省得多。
Q:能让 AI 直接写自动化脚本吗? 能写,但只给它稳定的用例,且脚本必须本地跑通再入库。AI 写的元素定位和等待逻辑经常想当然。
Q:回归范围怎么让 AI 判? 把改动说明和功能依赖关系给它,让它列"可能被牵连的功能+理由"。理由站不住的删掉——它只是提名,拍板靠你。
最后提醒
测试不是证明功能能用,而是找出它什么时候不能用。AI 负责快速铺开场景,你负责把它拽向异常、边界和权限——这个分工反过来,测试就成了摆设。
想直接上手?
这篇讲的活,打开 Glouth Chat 就能干:GPT-5.5 / Claude 等模型中文直接用,不用翻墙、不用海外卡。想给自己的 ChatGPT 账号开 Plus 的看国内充值指南;要把 AI 接进自己的工具,走 Link API。