Dify多知识库怎么路由？用问题分类器把客服、销售和内部资料分流

内容摘要

Dify多知识库路由适合客服、销售和内部资料混在一起的场景。本文拆解问题分类器、多路检索、召回测试和人工兜底，帮你减少答偏、口径冲突和权限误用，把RAG问答做得更稳定。

Dify 知识库做单一问答时并不复杂：上传资料、配置检索、写好提示词，就能先跑起来。但一到真实业务，问题很快会变成“资料太多、场景太杂、该查哪个知识库说不清”。

比如同一个客服机器人，既要回答售后政策，又要解释产品功能，还要给销售同事查报价口径。如果所有资料都塞进一个知识库，短期看省事，长期会出现召回混乱、答案口径打架、权限边界不清的问题。

这篇文章不重复讲基础搭建。如果你还没跑通第一版，可以先看 Dify客服知识库怎么搭？从资料清洗到人工接管的落地流程。本文重点解决第二阶段的问题：Dify 多知识库应该怎么分组、怎么路由、怎么测试。

相关背景也可以放到 AI智能体与自动化专题和老达AI实践专题里理解：真正可交付的 AI 应用，不是“能回答一次”，而是面对不同用户和不同资料时，能稳定选对信息来源。

先决定：多知识库是为了什么

不要因为资料多，就立刻拆成很多知识库。拆分的理由应该来自业务边界，而不是文件夹习惯。

我更建议按这四类边界来判断：

如果资料只是主题不同，但用户问题经常需要一起引用，可以先不拆太细。过度拆分会让路由变复杂，也会增加维护成本。

Dify 多知识库并不是只有一种玩法。你可以根据业务成熟度选择不同方案。

Dify 官方文档里提到，多路检索会在应用关联的多个知识库中同时查找相关片段，再通过 rerank 等策略把更相关的内容排到前面。这种方式适合资料边界不算敏感、用户问题可能跨多个资料源的场景。

例如一个产品问答助手，可以同时关联“产品手册”“常见问题”“版本更新记录”。用户问“这个功能为什么没有入口”，系统可能需要同时参考手册和版本说明。

它的优点是简单，缺点是如果知识库质量差、术语冲突多，就容易把相似但不该混用的内容召回到一起。

如果不同场景差异明显，更推荐先用 Question Classifier 做意图分类，再进入不同路径。Dify 的问题分类器可以根据用户输入，把问题分到预设类别，再走对应工作流。

例如你可以先分成：

这种方式的关键不是分类名字写得漂亮，而是类别之间要有足够区分度。不要同时设置“产品咨询”和“使用问题”这种容易重叠的类别，否则分类器会摇摆。

如果资料不适合直接上传到 Dify，例如还在企业内部系统、CRM、工单系统或自建知识平台里，可以用外部知识库 API 的方式接入。这样 Dify 负责应用编排，你自己的系统负责检索和权限控制。

这类方案更适合团队已经有内部数据系统的情况。个人或小团队刚开始做，先用 Dify 自带知识库跑通流程，再考虑外部知识库，不要一上来就把架构做重。

一个比较稳的 Dify 多知识库工作流，可以按下面的顺序设计：

这套流程看起来比单知识库复杂，但复杂度是有价值的：它把“该查哪里”和“怎么回答”分开了。后续要调优时，也能知道是分类错、召回错，还是生成错。

多知识库路由上线前，至少准备一组小测试集。每个类别 10 条问题，也比临时凭感觉强。

测试集要包含四类问题：

如果你发现知识库能召回资料，但答案仍然答偏，可以回看 Dify知识库命中率低怎么办？RAG召回、分段和测试优化清单。多知识库路由解决的是“去哪查”，召回优化解决的是“查得准不准”。

Dify 多知识库不是搭完就结束。上线后最好每周看一次日志，重点检查四件事。

不要只追求自动回答率。对业务来说，错误自动化比人工慢一点更危险。高风险场景宁可多一步人工确认，也不要让 AI 自己编一个看似完整的答案。

Dify 多知识库路由的核心，不是把资料拆得更细，而是让 AI 在回答前先做一次“业务判断”：这个问题属于谁、该查哪套资料、有没有权限直接回答。

对个人站长、内容运营和本地商家自动化服务来说，最实用的起步方案是“问题分类器 + 关键知识库 + 人工兜底”。先把售后、产品、销售这三类分清，再逐步补日志复盘和召回测试。

如果你想继续系统化搭建这类流程，可以关注 AI智能体与自动化专题。很多 AI Agent 项目失败，不是模型不够强，而是资料边界、流程边界和人工边界没有设计清楚。