一句话: 企业知识库接 AI,顺序是死的:先清文档,再定权限,然后才谈检索和问答。权限必须在检索层生效而不是写在提示词里,回答必须带来源,先拿一个部门试点再铺开。
很多团队的做法是把一堆文档上传,然后期待它什么都能答。结果很快翻车:文档太旧、权限不清、回答乱引用、同一个问题两个答案,员工不知道该信哪个。
知识库问答的质量上限,在接 AI 之前就定了。
第一步:先清理文档
垃圾文档进,垃圾回答出。先处理:过期制度、重复文档、命名混乱、没人维护的内容、含敏感信息的文件。
我们准备做企业内部知识库问答。 文档类型包括:[制度/产品文档/客服手册/技术文档/培训材料]。 请帮我设计文档整理规则,包括分类、命名、版本、负责人和过期内容处理方式。
两条规矩比什么都重要:每份文档有负责人,每份文档有有效期。做不到这两条,知识库上线三个月就开始答旧版制度。量力而行的做法是先挑 20-50 份高频文档精修到可靠,胜过把 2000 份囫囵塞进去。
第二步:权限在检索层生效
销售、客服、研发、财务能看的文档不一样,关键是在哪一层实现。权限过滤必须发生在检索层——按当前用户的权限先筛文档,筛完的内容才进模型。
靠提示词写"请不要向无权用户展示薪酬信息"是不行的,这等于把门禁贴在墙报上。模型拿到的上下文里只要有这份文档,就总有办法被问出来。
权限的源头要接公司现有的账号体系(SSO 或 HR 系统):转岗、离职当天,检索权限同步失效。单独维护一份权限表,三个月后必然和现实脱节。
第三步:回答必须带来源
你是企业内部知识库助手。 回答员工问题时必须遵守:
- 只基于知识库内容回答
- 不知道就说不知道
- 重要结论必须给来源
- 文档冲突时提醒用户确认最新版本
- 涉及权限、财务、人事敏感问题时引导人工确认
来源要具体到文档名、章节和更新时间,员工能一键回到原文核对。这条规则同时是兜底:就算答错了,员工还有原文可查。
第四步:边界和转人工
知识库 AI 适合答制度、流程、产品说明、常见技术问题。文档冲突、个人薪酬、客户敏感信息、合同责任,一律转人工——不是模型答不了,是答了没人敢负责。
整条链路的翻车点
| 阶段 | 关键动作 | 最常见的翻车 |
|---|---|---|
| 文档整理 | 定负责人、清过期 | 新旧制度同时被检索到 |
| 切分入库 | 按标题层级切块,带出处元数据 | 切太碎,答案前后失联 |
| 检索 | 权限过滤,关键词+语义混合检索 | 只用语义,搜编号型号搜不到 |
| 生成 | 限定只基于检索内容,强制带来源 | 检索为空时它开始编 |
| 上线 | 单部门试点,考题集回归 | 全公司直接铺开 |
考题集值得单独说:收集 50-100 个员工真实问题,人工写好标准答案。以后每次换模型、调检索策略,先跑一遍考题集看对错,而不是凭感觉"好像变好了"。里面记得塞几道知识库里没有答案的问题,看它会不会老实说不知道——这类题最能暴露编造倾向。
第五步:小范围试点
先选文档质量最好的一个部门跑一两个月。盯五个数:问得最多的问题、经常被命中的文档、回答不稳定的问题、需要补的文档、必须转人工的类型。知识库是边用边改出来的,不是上线那天就完工的。
试点期还有件事要做:明确告诉员工这是辅助工具、答案带来源、错了找谁反馈。预期管理做在前面,信任崩了再修很难。
坑与红线
- 向量库不带权限过滤,等于给全员开了一扇查薪酬、查合同的后门。这是这类系统最严重的事故类型。
- 作废制度没下架,AI 会引用着旧文档一本正经地答——带来源反而显得更可信,杀伤力更大。
- 员工把 AI 回答当最终依据。界面上明确写"以原文为准",重要事项点开来源确认。
- 文档批量送外部模型前过一遍合规:含个人信息、客户数据、商业机密的,先脱敏或留在边界内。
Glouth 怎么用
问答链路里的生成环节,走 Glouth Link 的 OpenAI 兼容接口,改一行 base_url 就能接,换模型不动业务代码,细节看 API 接入指南。整理文档规则、磨回答规则的草稿,用 Glouth Chat 快得多。
FAQ
Q:一定要上向量库吗? 不一定。文档量小、问题集中,关键词加全文检索就能跑得不错。先把权限和来源做对,检索方案以后可以换。
Q:自建还是买现成产品? 文档敏感、合规要求高的,选私有化或自建;只是想先验证价值,拿现成产品试点更快,试点结论再决定投入。
Q:怎么防止它一本正经地胡编? 三件套:限定只基于检索内容回答、强制带来源、考题集定期回归。编造不可能降到零,所以"以原文为准"必须写在界面上。
Q:文档更新后多久生效? 取决于入库流程,通常做定时增量同步。最容易漏的是删除:文档下架了,索引里的旧内容也要同步删,不然还会被检索到。
最后提醒
企业知识库 AI 的目标不是让模型显得聪明,是让员工更快拿到可信的答案。文档先清、权限先设、来源可查、风险转人工——这四件做扎实,问答系统才值得长期养。
想直接上手?
这篇讲的活,打开 Glouth Chat 就能干:GPT-5.5 / Claude 等模型中文直接用,不用翻墙、不用海外卡。想给自己的 ChatGPT 账号开 Plus 的看国内充值指南;要把 AI 接进自己的工具,走 Link API。