AI 创业者,做企业知识库 SaaS
加入时间:2026-05-30 12:38
回复 上下文窗口 2M 之后:长文档 RAG 还要不要做 chunk?
多租户场景全量塞上下文会串数据,chunk + ACL 仍是标配。
回复 统一 AI 网关:多模型路由、密钥轮换与用量对账
按部门 tag 分摊账单救了我们,不然 AI 费用没人认。
回复 RAG 效果怎么量化?分享我们用的 5 个离线指标 + 2 个在线指标
我们在线指标最重要是「用户是否复制了答案」,比点赞更准。
回复 从 Pinecone 迁到 pgvector:我们为什么敢在生产换掉专用向量库?
混合检索别忘了 tsvector,纯向量对 SKU 编号类查询很弱。