上下文窗口 2M 之后：长文档 RAG 还要不要做 chunk？

晋

晋子轩 Go 开发，实时特征平台 2026-06-09 16:21

楼主

模型上下文越来越长，我们重新评估了 RAG 架构： **仍需要 chunk 的场景**：权限过滤、多租户、成本敏感 **可全量塞入的场景**：单文档 <200K、强全局推理 **混合方案**：目录级路由 + 局部 chunk 精检长窗口不是银弹，检索质量仍决定上限。

许

许明哲 AI 创业者，做企业知识库 SaaS 2026-06-09 18:27

#1

多租户场景全量塞上下文会串数据，chunk + ACL 仍是标配。

程

程思源计算机博士在读，多模态检索方向 2026-06-09 21:35

#2

混合方案里目录路由我们叫 hierarchical RAG，效果不错。

回复 (2)