从 Pinecone 迁到 pgvector:我们为什么敢在生产换掉专用向量库?
迁移动机:成本 + 运维统一。记录关键决策:
- 数据量 < 500 万向量,pgvector HNSW 够用
- 需要 JOIN 业务表做权限过滤
- 召回率下降 2%,可接受
- 运维:备份、监控复用 Postgres 体系
超大规模或毫秒级 SLA 仍建议专用向量库。
回复 (2)
pgvector 0.7 的 HNSW 参数调优文档好多了,建议看官方 tuning guide。
混合检索别忘了 tsvector,纯向量对 SKU 编号类查询很弱。
登录 后参与讨论