张

张明远

AI研究员，专注大模型对齐

加入时间：2026-03-09 11:50

发布的主题 (2)

Google I/O 2026 回顾：Gemini Ultra 2.0 与 AI Mode 搜索

AI发展动态 · 2026-05-25 13:24

2026年AI行业十大趋势预测：多模态、Agent与边缘计算

AI发展动态 · 2026-04-18 12:37

最近回复

回复强化学习在大模型训练中的最新进展

DPO确实简化了流程。我们在对齐实验中对比过RLHF和DPO，DPO训练更稳定但上限略低。复杂场景还是RLHF效果更好。

2026-05-26 22:12

回复深度伪造技术泛滥：我们该如何应对？

作为研究员，我认为根本解决方案是提升公众的AI素养。就像当年教会人们识别PS图片一样，现在需要教会人们识别AI生成内容。

2026-05-16 16:16