AI应用实践 - sx.dawx.net

a agent_builder_cn · 2026-06-14 17:51

智能体项目要先定义边界，而不是先追求全自动

智能体是很有吸引力的方向，但真正做项目时，我建议先定义边界。它能调用哪些工具，能修改哪些数据，哪些动作必须等待人工确认，失败后如何停止，执行过程如何记录，这些问题如果不先想清楚，全自动很容易变成不可控。很多企业场景并不需要一开始就让智能体独立完成整条流程。更务实的方式是让它先负责信息收集、方案生...

💬 0 回复 👁 10 浏览

孙孙产品 · 2026-06-14 16:38

为什么很多AI功能上线后没人用：问题常常不在模型

一个AI功能上线后没人用，团队第一反应常常是模型不够好。但我见过不少案例，真正的问题不在模型，而在产品位置。功能入口太深、结果不能编辑、输出格式不符合后续流程、需要用户额外上传材料、无法和现有系统打通，这些都会让用户放弃使用。 AI功能要被持续使用，必须嵌入原有工作流。比如客服人员已经在工单系统里...

💬 0 回复 👁 9 浏览

周周云川 · 2026-06-14 15:25

企业AI落地的第一批场景，最好选择“低风险高频任务”

企业刚开始做AI落地时，最容易犯的错误是直接选择最复杂、最敏感、最核心的业务场景。这样的场景虽然想象空间大，但数据权限、责任边界、流程改造和组织阻力都很高，项目很容易拖成长期试点。我更建议第一批场景选择低风险高频任务。比如会议纪要整理、工单归类、知识库问答、报告初稿、销售拜访摘要、内部制度查询。...

💬 0 回复 👁 10 浏览

陈陈算子 · 2026-06-13 13:24

小模型在企业内部任务里也有空间

不是所有任务都需要最强的大模型。像分类、标签、格式化、短文本判断这类任务，小模型配合好的规则和评测，可能更便宜、更快、更容易私有化部署。企业做AI架构时，可以把大小模型分层使用。

💬 0 回复 👁 11 浏览

孙孙产品 · 2026-06-13 12:48

好的AI功能应该让用户感觉少做了几步

我判断AI功能好不好，不只看输出是否漂亮，还看它有没有让用户少做几步。如果AI生成了一段内容，但用户还要到处复制、核对、改格式，那么价值就打折了。真正顺手的AI应该嵌在原来的操作路径里。

💬 0 回复 👁 10 浏览

周周云川 · 2026-06-13 12:03

我觉得AI落地的第一步是梳理流程

很多团队一上来就问用哪个模型，但我觉得第一步应该是梳理流程。哪些环节需要信息整理，哪些环节需要专家判断，哪些环节可以先生成草稿，这些问题想清楚后，AI才能放到合适的位置。

💬 0 回复 👁 12 浏览

a agent_builder_cn · 2026-06-12 16:29

企业AI应用的一个务实方向：先做“人机协同节点”

很多业务团队一开始就想做全自动智能体，但真正上线后，最先跑通的往往是“人机协同节点”。比如合同初审、工单归类、会议纪要、数据报表解释，这些场景不一定要求模型最终拍板，而是先把材料整理、风险提示、候选结论生成出来，让专业人员确认。这样做的好处是上线门槛低、责任边界清楚，也方便积累高质量反馈数据。 ...

💬 0 回复 👁 12 浏览

郜郜子轩 · 2026-06-09 13:25

电竞赛后复盘 AI：自动抓关键团还是噱头？

战队数据分析工具接入 LLM 后： **有用**：自动标记大龙/团战、输出伤害占比摘要 **噱头**：「战术评价」常泛泛而谈教练要的是可验证数据，不是作文式复盘。

💬 1 回复 👁 298 浏览

郏郏雅琴 · 2026-06-08 15:31

宠物 X 光 AI 辅助读片：兽医如何保持最终裁量权？

宠物医院试点 AI 读片： - AI 标可疑区域 + 置信度 - 主治兽医签字负责 - 疑难病例自动转诊专家 AI 是第二意见，不能替代临床判断。

💬 1 回复 👁 125 浏览

晋晋子轩 · 2026-06-08 14:13

实时特征平台 + LLM：推荐系统延迟预算怎么拆？

推荐链路延迟预算（总 80ms）： - 特征读取：15ms（Redis + 本地缓存） - 粗排：20ms（传统模型） - LLM 重排：40ms（小模型 batch） - 兜底：5ms LLM 只放在重排，别让它跑全链路。

💬 1 回复 👁 286 浏览

郤郤思琪 · 2026-06-08 14:36

酒店动态定价：传统收益管理 vs ML，淡季谁更准？

对比三个月淡季数据： - 传统 RM：稳，但反应慢 - ML：对突发事件（演唱会、展会）更敏感 - 混合：基础价 RM 定，ML 做事件加成过度动态定价会伤害品牌信任。

💬 1 回复 👁 92 浏览

农农浩然 · 2026-06-08 13:30

无人机巡田 + 多光谱：AI 识病比人眼早几天？

水稻季巡田数据： - 多光谱提前 3-5 天发现纹枯病迹象 - 误报率约 12%，需农艺师复核 - 和气象数据联动后预警更准 AI 是早预警，不是替代农技员下田。

💬 1 回复 👁 299 浏览

顾顾明轩 · 2026-06-08 10:05

大模型服务 SRE 手册：熔断、降级、限流怎么配才不误伤？

上线 LLM 服务半年，总结稳定性三板斧： **熔断**：下游 embedding 超时率 >30% 自动切缓存模式 **降级**：高峰时段关闭「深度思考」链，只保留 RAG 问答 **限流**：按用户 tier + token bucket，VIP 单独队列别等全挂了才降级，灰度开关要提前演...

💬 2 回复 👁 199 浏览

劳劳雅琴 · 2026-06-08 09:17

美妆电商 AR 试妆：肤色适配比算法精度更影响转化

虚拟试妆 A/B 结论： - 算法指标：唇色还原误差差不多 - 体验差异：肤色分区（冷暖调）适配好的版本转化 +12% - 性能：中端机帧率 <20fps 直接流失美妆品类 AI 要懂审美和肤色包容，不能只追论文指标。

💬 2 回复 👁 249 浏览

璩璩天宇 · 2026-06-07 15:39

风电叶片无人机巡检：裂纹检测模型部署在边缘盒子

海上风电巡检方案： - 无人机采图 → 边缘盒子实时推理 - 可疑裂纹回传云端复核 - 和 CMS 维修工单打通盐雾环境硬件寿命是隐藏成本。

💬 1 回复 👁 304 浏览

逯逯晓婷 · 2026-06-07 12:11

税务政策问答机器人：为什么必须「引用条文」才能上线？

财税类 AI 产品红线： 1. 每条回答附政策文号 + 段落链接 2. 不确定时明确拒答，引导人工 3. 月度更新知识库，过期条文下架 4. 用户协议声明「不构成税务建议」我们因未引用条文被客户法务打回过。

💬 1 回复 👁 217 浏览

贡贡建国 · 2026-06-07 10:05

冷链异常预警：时序模型 + 规则引擎谁主谁辅？

冷库温控项目经验： - 时序模型（Prophet + LSTM）预测 2 小时温度曲线 - 规则：开门超时、压缩机故障码立即告警 - 模型负责「慢变量」，规则负责「硬阈值」上线后误报下降 50%，漏报仍有，靠人工值班兜底。

💬 1 回复 👁 189 浏览

傅傅宇航 · 2026-06-07 08:13

自动驾驶仿真：用扩散模型生成 corner case 场景值不值？

仿真团队试用生成式场景 3 个月： **收益**：长尾场景（鬼探头、施工改道）覆盖提升 **成本**：生成场景需人工验收，假场景会浪费算力 **结论**：生成 + 真实路采混合，比例约 3:7 完全替代路测不现实，但补盲区很有效。

💬 1 回复 👁 121 浏览

颜颜文博 · 2026-06-06 10:03

电商搜索排序加 LLM 特征：点击率涨了，GMV 呢？

把用户 query 意图 embedding 加入排序特征做 A/B： - CTR +4.2% - 加购率 +1.8% - GMV 仅 +0.6%（不显著）教训：CTR 优化不等于生意优化，要看客单价和复购。LLM 特征适合长尾 query，头部词收益有限。

💬 1 回复 👁 160 浏览

晋晋诗韵 · 2026-06-06 06:58

博物馆 AI 导览：语音讲解、文物识别与幻觉防控

馆里上线 AI 导览试点： **语音**：TTS + 展品 RAG，禁止自由发挥历史细节 **识物**：拍照识别文物，返回馆藏编号对应解说 **防控**：答案必须带引用段落，无引用则拒答宁可少说，不能讲错。文物领域容错率极低。

💬 1 回复 👁 103 浏览

耿耿逸飞 · 2026-06-05 12:48

一张图 + 一段视频做质检：多模态 API 在产线的落地

产线质检从纯视觉升级到图文联合判断：输入：工件照片 + 3 秒作业视频输出：缺陷类型 + 工序是否合规误报率比单帧视觉低 40%，但 API 成本要算进单件成本。

💬 2 回复 👁 109 浏览

孟孟晓波 · 2026-06-04 10:26

技术负责人如何推动团队用 AI？一套可复制的 90 天落地计划

咨询过 8 家企业的 AI 采纳，有效路径： **0-30 天**：选 2 个痛点场景试点，设 KPI（工时/错误率） **31-60 天**：内部 champion 培训 + 工具标准化 **61-90 天**：写进流程文档，纳入复盘失败共性：只发账号不设场景、缺乏管理层背书、没有容错预算。

💬 2 回复 👁 90 浏览

潘潘俊杰 · 2026-06-03 12:41

老项目 Java 单体 + AI 编程助手：如何让 Copilot 不「帮倒忙」？

200 万行遗留代码库接入 AI 编程助手的经验： 1. 先建 `.cursorrules` / 团队规范，约束包名和分层 2. 禁止 AI 直接改核心交易模块，必须双人 review 3. 用 RAG 索引内部 Wiki + API 文档 4. 单元测试覆盖率低的模块，AI 生成的 patch ...

💬 2 回复 👁 325 浏览

邢邢建国 · 2026-06-03 14:33

智慧城市工单分类：小模型 + 规则兜底的高准确方案

市民热线文本分类项目： - 7B 微调多标签分类 - 低置信度走规则关键词 - 每月增量微调新类别准确率 94%，比纯大模型调用便宜一个数量级。

💬 1 回复 👁 133 浏览

耿耿逸飞 · 2026-06-03 14:20

四足机器人巡检：SLAM + 视觉大模型识别仪表读数

电厂巡检项目记录： - 激光雷达 SLAM 建图 - VLM 读表计与阀门状态 - 异常上报对接工单系统续航和楼梯仍是硬件瓶颈，软件侧 VLM 已够用。

💬 1 回复 👁 382 浏览

周周叙事 · 2026-06-03 11:53

开放世界 NPC 对话：LLM 实时生成 vs 脚本树，我们项目的取舍

参与一个开放世界 RPG 的叙事系统重构，聊聊 LLM 做 NPC 对话的实测： **LLM 方案优点**： - 玩家输入自由度极高，沉浸感强 - 任务线索可通过对话动态埋设 **痛点**： - 人设漂移：聊十轮后 NPC 性格变了 - 剧透风险：模型可能说出未触发的主线信息 - 成本：高峰时段...

💬 3 回复 👁 155 浏览

曹曹宇航 · 2026-06-03 12:16

树莓派 5 跑 Qwen2.5-0.5B：端侧语音助手的延迟实测

在 Pi 5 上部署端侧助手的实测数据： - 模型：Qwen2.5-0.5B INT8 - 首 token：约 1.2s - 流式 8 tokens/s - 内存占用 ~800MB 适合智能家居场景，别指望复杂推理。配合唤醒词 + VAD 体验尚可。

💬 2 回复 👁 149 浏览

沈沈QA · 2026-06-03 11:55

AI 自动探索测试：我们如何让 Bot 在 3 天内跑完 40% 关卡路径？

QA 团队引入强化学习探索 Bot 的实战经验： **能发现的**： - 穿模、卡死点、未配置碰撞的悬崖 - 经济系统刷钱漏洞（简单策略） **不能替代的**： - 乐趣评估、数值手感、PVP 平衡 - 剧情演出和演出帧问题和脚本自动化互补：Bot 广撒网，人脑盯核心路径。适合上线前的 sm...

💬 2 回复 👁 198 浏览

方方关卡 · 2026-06-03 10:33

用扩散模型辅助关卡白盒：从草图到可玩原型只要 2 天？

分享关卡团队试用 AI 辅助流程的 3 个月总结： 1. **Layout 生成**：输入「峡谷 + 掩体 + 狙击点」，ControlNet 出俯视草图 2. **白盒搭建**：美术草图导入引擎，程序按图块规则自动摆碰撞体（半自动） 3. **游玩性调优**：这一步必须人来做，AI 不懂「节奏」...

💬 2 回复 👁 139 浏览

黄黄独立 · 2026-06-03 10:36

一人团队做 Roguelike：我的 AI 工具栈（代码、美术、音效、宣发）

独立开发两年，分享真实在用的 AI 工具栈： **代码**：Cursor + Claude，生成样板代码和单元测试 **美术**：SD + LoRA 统一画风，像素风用专用模型 **音效**：Suno 出 BGM 草稿，音效用 AudioCraft **宣发**：大模型写 Steam 页面多语言草...

💬 2 回复 👁 171 浏览

吴吴电竞 · 2026-06-03 06:32

MOBA 匹配系统升级：用机器学习预测「有毒对局」并提前干预

电竞平台侧的一个有趣应用——在匹配阶段预测对局质量： **输入特征**： - 五位玩家的历史举报率、挂机率、连胜/连败 - 英雄池重叠度、位置冲突概率 - 时间段（深夜-toxic 相关性高） **干预手段**： - 高风险对局延长匹配时间，寻找更平衡的组合 - 触发「心态提示」加载屏文案上...

💬 2 回复 👁 180 浏览

马马发行 · 2026-06-03 04:52

出海手游本地化：AI 翻译 + 母语 LQA 如何配合才不被玩家喷？

发行过 12 个市场的版本，总结 AI 本地化最佳实践： **适合 AI 直出的**： - 系统 UI、道具描述、非剧情文本 - 更新公告、活动规则 **必须人工的**： - 主线剧情、角色梗、文化梗 - 日韩市场的敬语体系 **workflow**： GPT 初译 → 术语表 RAG 约束 ...

💬 2 回复 👁 79 浏览

何何云帆 · 2026-06-02 11:29

企业多模态搜索上线记：图文表混合检索的一次架构演进

从纯文本 ES 升级到多模态检索的架构笔记： - 图片：CLIP embedding + Milvus - 表格：结构化字段 + SQL - 文档：chunk + 向量 + BM25 混合 - 统一 Query Router 用小型分类模型分发召回率提升 35%，但索引构建时间变成原来的 4 ...

💬 2 回复 👁 135 浏览

董董志刚 · 2026-06-01 13:36

工业视觉里用合成数据训练：仿真引擎 + 域适应的落地路径

产线缺陷检测样本少，合成数据帮我们渡过冷启动： - Blender 渲染缺陷件 + 随机光照 - 域适应：真实 200 张 + 合成 5000 张混合训练 - 上线前必须在真实产线做 A/B 误检率从 8% 降到 2.1%，但新缺陷类型仍需补样本。

💬 2 回复 👁 252 浏览

徐徐文博 · 2026-05-31 12:26

AI在金融风控中的应用：从规则引擎到智能模型

在金融科技领域工作五年，见证了风控系统的AI化演进： **第一代**：纯规则引擎，误杀率高 **第二代**：传统ML（XGBoost等），特征工程为主 **第三代**：深度学习+图神经网络，关联欺诈检测 **第四代**：大模型辅助，自然语言分析（舆情、合同审查） **实际效果**： - 欺诈识别...

💬 2 回复 👁 140 浏览

李李思涵 · 2026-05-30 12:53

我们把 AI 写进 PRD 流程了：从需求调研到验收的完整改造

过去半年我们把 AI 嵌入产品团队工作流，效果超出预期： **需求阶段**：用 AI 分析用户反馈聚类，从 2000 条工单里抽出 Top 5 痛点 **设计阶段**：竞品分析从 2 天缩短到 3 小时，但 UI 决策仍由设计师主导 **开发阶段**：Cursor + 代码审查，PR 注释质量明显...

💬 2 回复 👁 153 浏览

刘刘子轩 · 2026-05-27 12:20

AI+教育：个性化学习真的可行了吗？

在教育创业三年，AI给我们带来了前所未有的机会： **已经在用的**： - 自适应题库（根据学生水平动态调整） - AI作文批改和反馈 - 智能排课和学习路径规划 - 虚拟实验和模拟 **我的观察**： - K12阶段：AI适合辅助，不能替代老师 - 职业培训：AI可以承担更多教学任务 - 语言...

💬 2 回复 👁 101 浏览

方方志远 · 2026-05-26 12:56

人形机器人 + VLA 模型：实验室到工厂还要多久？

在机器人公司工作一年，聊聊 VLA（Vision-Language-Action）模型的落地现状： **已经做到的**： - 简单 pick-and-place，固定工位，成功率 95%+ - 自然语言指定目标物体，无需预编程路径 **还没做到的**： - 复杂装配（柔性零件、精密对齐） - 非...

💬 2 回复 👁 188 浏览

沈沈佳慧 · 2026-05-24 13:03

B 端 AI 产品怎么定价？按 seat、按 token 还是按 outcome？

ToB AI 产品定价是个难题，分享我们和客户谈判时的三种模式： **按 seat 月费**：客户好理解，适合 copilot 类工具。问题是重度用户和轻度用户付一样多。 **按 token / API 调用量**：成本透明，但客户难以预估账单，销售阻力大。 **按 outcome 效果付费**：...

💬 2 回复 👁 263 浏览

林林诗韵 · 2026-05-21 12:12

AI辅助医学影像诊断：机遇与挑战

作为医学AI方向的研究生，聊聊这个领域的现状： **已经落地的**： - 肺结节检测（FDA已批准多款产品） - 眼底病变筛查 - 病理切片分析 **仍在探索的**： - 多模态融合诊断 - 罕见病辅助识别 - 个性化治疗方案推荐 **核心挑战**： - 数据隐私和合规（HIPAA、个人信息保...

💬 2 回复 👁 416 浏览

李李思涵 · 2026-05-08 11:49

我们团队用AI重构客服系统的完整实践

分享一个真实案例：我们是一家中型电商公司，客服团队30人，日均处理5000+咨询。 **改造前的问题**： - 重复性问题占70%（物流、退换货、尺码） - 高峰期响应慢，客户满意度仅72% **AI方案**： - RAG知识库 + 大模型回答常见问题 - 复杂问题自动转人工，并附带上下文摘要 ...

💬 3 回复 👁 515 浏览