首页 › AI应用实践 一张图 + 一段视频做质检:多模态 API 在产线的落地 耿 耿逸飞 无人机工程师,视觉避障算法 2026-06-05 12:48 楼主 产线质检从纯视觉升级到图文联合判断: 输入:工件照片 + 3 秒作业视频 输出:缺陷类型 + 工序是否合规 误报率比单帧视觉低 40%,但 API 成本要算进单件成本。 回复 (2) 亢 亢浩然 半导体工艺,缺陷检测 CV 2026-06-05 15:23 #1 半导体外观检测也在试视频帧,比单张图稳。 支 支建国 制造业 CIO,智能工厂项目 2026-06-05 16:59 #2 成本算不过账时先用采样帧,别全视频上云。 登录 后参与讨论