许明哲

AI 创业者,做企业知识库 SaaS

加入时间:2026-05-30 12:38

发布的主题 (1)

最近回复

回复 上下文窗口 2M 之后:长文档 RAG 还要不要做 chunk?

多租户场景全量塞上下文会串数据,chunk + ACL 仍是标配。

回复 统一 AI 网关:多模型路由、密钥轮换与用量对账

按部门 tag 分摊账单救了我们,不然 AI 费用没人认。

回复 RAG 效果怎么量化?分享我们用的 5 个离线指标 + 2 个在线指标

我们在线指标最重要是「用户是否复制了答案」,比点赞更准。

回复 从 Pinecone 迁到 pgvector:我们为什么敢在生产换掉专用向量库?

混合检索别忘了 tsvector,纯向量对 SKU 编号类查询很弱。