1月31日,OpenAI正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。据OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下股票推荐平台,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。
在博士级科学问题(GPQA Diamond)方面股票推荐平台,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。