复旦联合南洋理工提出基于视觉Grounding的多轮强化学习框架MGPO 来源:机器之心Pro 本文的主要作者来自复旦大学和南洋理工大学 S-Lab,研究方向聚焦于视觉推理与强化学习优化。 先进的多模态大模型(Large Multi-... 抹茶交易所行情 2025-07-21 0 评论 8 阅读