阿里通义千问:全球开源大模型生态圈的焦点
开源领域的明星
在当今全球开源大模型生态圈中,阿里无疑是最受瞩目的存在。继DeepSeek和“AI教母”李飞飞之后,英伟达也对阿里投来了橄榄枝。这一系列合作不仅彰显了阿里的技术实力,也进一步巩固了其在开源领域的领先地位。
英伟达与阿里携手共创
上周,英伟达在阿里发布“混合推理模型”千问3开源当日迅速宣布适配,并于5月9日开源了全新的代码推理模型Open Code Reasoning(OCR),该模型的基础架构源自通义千问。OCR模型提供7B、14B、32B三种尺寸,其中OCR-Qwen-32B-Instruct在LiveCodeBench评测中表现出色,成功超越了OpenAI公司的o3-mini和o1模型。
技术突破与潜力无限
尽管通义千问已经迭代至3.0版本,但英伟达基于其上一代模型开发出的OCR-Qwen-32B-Instruct依然具备顶尖性能。这表明通义千问可能还有更多未被发掘的潜力等待解锁。此次合作不仅展示了通义千问的强大基础能力,也为开源模型的发展提供了新的思路。
开源平台共享成果
目前,英伟达已将OCR系列模型的代码及数据集公开分享至Hugging Face平台,供全球开发者免费学习和使用。OCR-Qwen-32B-Instruct在LiveCodeBench的pass@1测试中取得了61.8%的成绩,超越了多个闭源模型代表。这一成果打破了长期以来关于开源模型能力逊于闭源模型的固有认知。
开源模型的新时代
通过高质量训练和优化,即使是非最新版本的开源模型也能达到甚至超越闭源模型的表现。这证明了只要底座模型足够优秀,开源模型同样能够展现卓越的能力。正如“AI教母”所倡导的理念,开放合作将成为推动人工智能领域进步的重要力量。
本文转载自互联网,若有侵权,请联系站长说明,禁止转载。
本文链接: https://www.xiezha.com/question/c70a6a4c7dfb42f5a51073752687848c.html