OpenAI-o4mini-RFT 技术调研及实践

486 阅读 0 评论 0 点赞

出处：mp.weixin.qq.com

据OpenAI开发者账号提到，自去年12月以来一直在进行的强化学习微调（RFT）功能现已支持OpenAI o4-mini模型。5月8日，OpenAI的o4-mini与强化微调（RFT）正式上线。强化微调只支持o系列的推理模型，目前只支持o4-mini。

强化微调（Reinforced Fine-Tuning, RFT）是OpenAI推出的一种新型模型训练方法，它整合了传统的监督微调（Supervised Fine-Tuning, SFT）、奖励模型和强化学习的三大要素。

点赞(0) 打赏

本文分类：技术开发
本文标签：360技术 OpenAI
浏览次数：486 次浏览
发布日期：2025-05-29
本文链接：https://www.willenyao.com/a/571.html

本站所有素材均来自网络或用户分享，版权归属原作者，如果侵犯了您的版权，请随时联系我们（邮箱：970251487@qq.com）进行删除。

上一篇 > 什么！我把SQL编辑器装进了大模型？
下一篇 > JavaScript 变量作用域详解：从入门到避坑指南

评论列表共有 0 条评论

暂无评论

发表评论取消回复

提交
网站意见
建议发表
评论返回
顶部