苹果的研究人员发现,当前的“思考”人工智能模型仍无法达到人类期望的推理水平。他们指出,发展人工通用智能(AGI)的竞赛仍有很长的路要走。最新更新的人工智能大型语言模型(LLMs)如OpenAI的ChatGPT和Anthropic的Claude包括大型推理模型(LRMs),但这些模型的基本能力、扩展性和局限性“仍不够了解”,苹果研究人员在6月的一篇名为“思考的幻觉”的论文中指出。他们指出,当前的评估主要集中在已建立的数学和编码基准上,“强调最终答案的准确性”。
新闻来源 (Source): Cointelegraph.com News
作者 (Author): Martin Young