UCLA与Meta AI研究人员推出的d1框架通过强化学习显著提升了扩散式大语言模型(dLLMs)的推理能力。该框架结合监督微调和新算法diffu-GRPO,优化了模型的学习效果,尤其在生成长响应时展现出自我修正能力。d1框架为企业提供了加速与自动化的数字工作流程解决方案,适应不同的延迟和成本需求,展示了扩散式模型在质量、速度和成本上的优势。
扫码打开当前页
之前
魔果智讯(moguoai.cn)是中国人工智能领域的专业媒体门户。本站汇集了最全面的人工智能新产业资讯及学科知识和学习资料,包括但不限于人工智能、机器人、无人驾驶、可穿戴、云计算等新兴技术信息资讯,坚持为从业者提供高质量内容和多项产业服务,是人工智能爱好者学习和交流不可或缺的平台。