【资料图】
随着人工智能(AI)模型体积的增大,一些研究团队开始倡导使用效率更高、体积更小的专用模型来取代“大型语言模型”。OpenAI的ChatGPT虽然在技术界备受瞩目,但在处理需要推导的数学问题时,其表现并不理想。例如,对于一道代数题,ChatGPT有时能给出正确答案,但大多数情况下会回答错误。在一次早期推导能力测试中,ChatGPT在面对美国中学水平的数学题集时,只答对了26%。 然而,2022年6月,谷歌的一款名为Minerva的专用数学计算模型打破了业界对“大语言模型计算数学不行”的观点。据报道,Minerva在数学题集中答对了50%,这一结果让AI领域的研究者们感到惊讶。微软研究院的机器学习专家Sébastien Bubeck对此表示:“在AI圈子里,这还真是个新奇事。” 这一结果也证实了研究团队长期以来的怀疑:训练更大型的AI模型并不是解决“逻辑问题”的正道。然而,也有观点认为,更大的模型只是在碰巧与训练集相关的问题上回答得更为出色,而没有获得回答全新问题的能力。
标签: