当地时间周二,法国人工智能初创公司Mistral宣布推出其首个推理模型,声称能够与OpenAI和DeepSeek等竞争对手的产品相抗衡。
Mistral联合创始人兼首席执行官Arthur Mensch当天表示:“我们将在几个小时内发布我们的新推理模型,这个模型非常有竞争力,能够与其他所有产品相抗衡,而且它还有一个特别之处,就是能够用多种语言进行推理。”
推理模型是一种可以通过逐步逻辑思维过程执行更复杂任务的AI系统。据Mensch介绍,Mistral的新模型在数学和编程方面都很出色。
目前,市场上流行的推理模型包括OpenAI的o1/o3、DeepSeek的R1、Claude3.7和Gemini Thinking等,这些推理模型在处理不同复杂度任务时的表现有所不同。
在低复杂度任务中,传统大模型表现更佳;而在中等复杂度任务中,具备思维机制的推理模型更具优势;然而,在处理高复杂度任务时,这些模型可能会陷入完全失效状态。此外,这些模型在处理简单问题时存在“过度思考”的问题,而在问题复杂性上升到临界点时,其准确性会显著下降,甚至接近零。
据悉,Mistral是一家成立于2023年初的公司,由前谷歌DeepMind、Meta等科技巨头的研究人员创立,获得了数十亿美元的融资。在短短两年时间里,Mistral发布了一系列开源AI模型,还有一个类似于ChatGPT的聊天机器人LeChat。
Mensch声称,其即将推出的Magistral推理模型的独特卖点是,它能够用欧洲语言进行推理。“从历史上看,我们看到美国的模型用英语进行推理,中国的模型更擅长用中文进行推理。”
虽然Magistral目前专注于欧洲语言,但Mensch补充说,Mistral将在以后增加对更多语言的支持。
今年年初,中国人工智能初创公司DeepSeek发布了一款名为R1的推理模型,这个模型震惊了人工智能社区和全球市场,因为它能够以更低的成本提供与OpenAI的o1模型相当的性能。
免责声明:以上内容为本网站转自其他媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。