【简述】 AI初创公司Inflection发布了其自家基础AI模型,旨在与Google和OpenAI的大型语言模型展开竞争。Inflection-1模型的性能表现令人瞩目,然而,我们仍需等待更广泛的使用和独立评估来验证其实际效果。
【正文】 近日,AI初创公司Inflection宣布推出其自家的基础AI模型,旨在与行业巨头Google和OpenAI的大型语言模型展开竞争。该模型名为Inflection-1,规模和功能与GPT-3.5(又称ChatGPT)相当,并使用了相应的训练计算资源。据公司称,Inflection-1在与同级别模型的比较中具备竞争力,甚至在某些方面表现出色,为此还发布了一份技术备忘录,详细描述了其在GPT-3.5、LLaMA、Chinchilla和PaLM-540B等模型上的基准测试结果。
备忘录显示,Inflection-1在多个指标上取得了不错的表现,例如中高级学校水平的考试任务(如生物学101)和常识性基准测试(例如“如果Jack将球扔到屋顶上,Jill将其扔回来,那么球在哪里?”)。然而,在编码方面,Inflection-1相对于GPT-3.5略显不足,而与之相比,GPT-4则在编码能力上遥遥领先;OpenAI的最大型号在该领域的质量提升广为人知,这也不足为奇。
Inflection表示,他们计划发布更大型号的模型,与GPT-4和PaLM-2(L)相媲美,但显然他们会等到结果值得发布之时。无论如何,无论是Inflection-2还是Inflection-1-XL,都在酝酿之中,但尚未完全成熟。
目前,学术界尚未对AI模型进行类似拳击体重级别的划分,但这两个概念之间有相当的对应关系。毕竟,我们不会期望一个蝇量级选手与重量级选手进行比赛,因为它们几乎是不同的运动。AI模型也是如此:较小的模型虽然功能较弱,但能够在手机上高效运行,而较大的模型则需要数据中心。这是一个无法直接进行对比的问题。
然而,我们仍需保持谨慎。尽管Inflection-1在基准测试中表现出色,但在广泛使用和独立评估之前,对其所声称的各项优势我们仍需持保留态度。如果您想亲自体验Pi对话系统,可以在其中一个消息应用程序上添加它,或者在网上与其进行交谈。
【观点】 这则新闻宣布了Inflection推出自家的基础AI模型,与行业领先的公司Google和OpenAI展开竞争。竞争有助于推动技术的进步和创新,而Inflection-1模型在基准测试中表现出色,给人们带来了期待。然而,在公开使用和独立评估之前,我们需要保持谨慎,并等待更多验证数据的出现。这也提醒我们,在评估和采用人工智能技术时需要更多客观全面的信息,以确保其质量和可靠性。期待Inflection能够继续发展和改进,为用户带来更好的个人化人工智能体验。