AI大事件!Reflection 70B横空出世,刷新AI学习方式!
最新推出的AI模型Reflection 70B开启了全新的学习模式,让AI可以在推理过程 中主动纠正自己的错误和幻觉,堪称AI学习的里程碑。
就拿最近火热的数学测试为例:Reflection 70B最初也犯了一开始常见的错误,但它在标签下主动改正了自己的错误。
在官方评测中,Reflection 70B全面超越了众多开源模型,包括Llama 3.1 405B、GPT-4o、Claude 3 Opus、Gemini 1.5 Pro,在数学基 准GSM8K上更是直接刷爆测试集,获得惊人的99.2%得分。
这一结果让业界领袖Noam Brown惊呼:GSM8K得分99%!是时候正式淘汰这个基准了吗?
Reflection 70B一经上线,立即引爆网友热情,试玩活动一度成为抢手货。甚至Meta公司还主动提供更多算力支持。
在网友测试中,Reflection 70B展现出了 惊人的能力,能够正确回答GSM8K数据集中本身答案错误的问题,令人印象深刻。
更为惊艳的是,不仅仅是数学测试,就连生造词“drirrrngrrrrrnnn”中的r个数目,Reflection 70B也能轻松应对。
小团队的开源超越闭源所带来的惊喜让网友们惊叹,如今最强开源模型已经可以在本地轻松运行。
Reflection 70B引领AI学习新风向
Reflection 70B采用了一种名为Reflection-Tuning的训练方法,让模型能够在最终确定回应前检测并纠正自身推理中的错误,这成为其能力提升的重要关键。
其数据训练来源于GlaiveAI平台生成的合成数据,基于Llama 3.1 70B Instruct开发,引入了一些特殊的tokens,结构化输出过程。
在使用Reflection 70B时,官方还分享了一些小tips,比如初步建议设定参数为temperature为0.7,top_p为0.95,并附加上“Think carefully.” 在Prompt末尾以提高准确性。
Reflection 405B预计发布,性能将进一步提升
官方还预告下周将发布更大的Reflection 405B,有望进一步超越现 有模型 Sonnet 和 GPT-4o。
同时,Reflection 70B的权重已经公开,API访问将由Hyperbolic Labs提供,让更多人能够体验Reflection 70B的强大功能。
创业团队背后的故事
Reflection 70B的背后是一支小团队,由HyperWriteAI的CEO Mutt Shumer领衔。Mutt Shumer是一位连续创业者,曾创立过多个团队,开发出各种颠覆性的AI应用产品。
对于那些对AI技术及其创新感兴趣的朋友,可以期待Reflection 405B的发布,并跟随着这场AI学习革命的脚步 。
AI万花筒专注于AI领域的工具平台和资讯网站,为您提供最新的AI资讯、技术动态和实用工具,欢迎访问我们的官网:AI万花筒官网。