开源大模型新王Reflection 70B横空出世，新技术可纠正自己幻觉

2,203 0 0

AI大事件！Reflection 70B横空出世，刷新AI学习方式！

最新推出的AI模型Reflection 70B开启了全新的学习模式，让AI可以在推理过程中主动纠正自己的错误和幻觉，堪称AI学习的里程碑。

就拿最近火热的数学测试为例：Reflection 70B最初也犯了一开始常见的错误，但它在标签下主动改正了自己的错误。

在官方评测中，Reflection 70B全面超越了众多开源模型，包括Llama 3.1 405B、GPT-4o、Claude 3 Opus、Gemini 1.5 Pro，在数学基准GSM8K上更是直接刷爆测试集，获得惊人的99.2%得分。

这一结果让业界领袖Noam Brown惊呼：GSM8K得分99%！是时候正式淘汰这个基准了吗？

Reflection 70B一经上线，立即引爆网友热情，试玩活动一度成为抢手货。甚至Meta公司还主动提供更多算力支持。

在网友测试中，Reflection 70B展现出了惊人的能力，能够正确回答GSM8K数据集中本身答案错误的问题，令人印象深刻。

更为惊艳的是，不仅仅是数学测试，就连生造词“drirrrngrrrrrnnn”中的r个数目，Reflection 70B也能轻松应对。

小团队的开源超越闭源所带来的惊喜让网友们惊叹，如今最强开源模型已经可以在本地轻松运行。

Reflection 70B引领AI学习新风向

Reflection 70B采用了一种名为Reflection-Tuning的训练方法，让模型能够在最终确定回应前检测并纠正自身推理中的错误，这成为其能力提升的重要关键。

其数据训练来源于GlaiveAI平台生成的合成数据，基于Llama 3.1 70B Instruct开发，引入了一些特殊的tokens，结构化输出过程。

在使用Reflection 70B时，官方还分享了一些小tips，比如初步建议设定参数为temperature为0.7，top_p为0.95，并附加上“Think carefully.” 在Prompt末尾以提高准确性。

Reflection 405B预计发布，性能将进一步提升

官方还预告下周将发布更大的Reflection 405B，有望进一步超越现有模型 Sonnet 和 GPT-4o。

同时，Reflection 70B的权重已经公开，API访问将由Hyperbolic Labs提供，让更多人能够体验Reflection 70B的强大功能。

创业团队背后的故事

Reflection 70B的背后是一支小团队，由HyperWriteAI的CEO Mutt Shumer领衔。Mutt Shumer是一位连续创业者，曾创立过多个团队，开发出各种颠覆性的AI应用产品。

对于那些对AI技术及其创新感兴趣的朋友，可以期待Reflection 405B的发布，并跟随着这场AI学习革命的脚步。

AI万花筒专注于AI领域的工具平台和资讯网站，为您提供最新的AI资讯、技术动态和实用工具，欢迎访问我们的官网：AI万花筒官网。

# 资讯

文章版权归作者所有，未经允许请勿转载。

Gen-2更新重磅来袭，4K好莱坞大片级视频生成技术或重塑电影产业

花花

2,083

最强大模型Llama 3正式发布，达到GPT-4级别，开启AI新纪元

万万

2,113

机器人才是未来？科技巨头联合投资，人形机器人初创公司Figure AI完成巨额融资

花花

3,208

20分钟一条小说推文？AI动画一键搞定？全网最强AI绘图视频生成工具幻动创生正式发布！

AI助理

9,017

GPT-4o 完美安装 Macbook，网友最爱的完整攻略

优优

4,112

安全话题恒久远！为什么Google、Microsoft、OpenAI和Anthropic宣布创建AI安全基金，投资逾1000万美元？

花花

2,367

开源大模型新王Reflection 70B横空出世，新技术可纠正自己幻觉

AI大事件！Reflection 70B横空出世，刷新AI学习方式！

Reflection 70B引领AI学习新风向

Reflection 405B预计发布，性能将进一步提升

创业团队背后的故事

AI游戏引擎面世！和UE结合使用实时效果更佳

谷歌推出“咳嗽模型”，咳嗽声音也能揭示健康秘密，HeAR助力AI辅助疾病诊断

相关文章

热门标签

热门文章

相关文章