苹果研究人员发现,目前的“思考”人工智能模型仍无法达到人类期望的推理水平。他们指出,发展人工通用智能(AGI)的竞赛仍有很长的路要走,目前领先的人工智能模型在推理方面仍然存在困难。
最近更新的领先人工智能大型语言模型(LLMs)如OpenAI的ChatGPT和Anthropic的Claude已经包括了大型推理模型(LRMs),但苹果的研究人员在名为“思考的幻觉”的六月论文中指出,它们的基本能力、扩展属性和限制“仍然不够了解”。
他们指出,当前的评估主要集中在已建立的数学和编码基准上,“强调最终答案的准确性”。【阅读更多】。
新闻来源 (Source): Cointelegraph.com News
作者 (Author): Martin Young