
封面新闻记者欧阳宏宇
不懂中文的外国游客去医院看病,不知道相应科室怎么走。于是,他拿着一张楼层地图,问人工智能助手“骨科在哪一层”“耳鼻喉科去哪一层”。AI会根据图片信息给出文字回复...AI大模型技术不断进化,图像问答、图形理解等能力正在加速开源。
8月25日,阿里云推出大型视觉语言模型Qwen-VL,并宣布直接开源。据介绍,该模型除了图形输入、识别、描述、问答、对话等基本能力外,还增加了图像中的视觉定位、文本理解等多模态信息理解能力,开发者可以直接从magic社区下载并投入商业使用。

全球科技巨头纷纷推出人工智能大模型,开源技术之路得到了国内大部分大模型开发者的响应。《中国人工智能大模型图谱研究报告》显示,国内已发布的大模型中,超过一半实现了开源,其中主要来源为高校和科研机构。
除了依桐钱文,百度文心近日也宣布将插件生态系统逐步开放给第三方开发者;今年5月,知乎的墙智研发的中国大型基座模型CPM-Bee 10b也宣布全面开源。此外,清华大学的ChatGLM-68和复旦大学的MOSS也实现了开源。
但也有AI大模型头部产品选择闭源开发,自建“护城河”。比如火遍全球之后,ChatGPT选择了闭源开发;华为云此前也表示,盘古模型未来不会开源。
目前开源和闭源谁是主流还没有定论。中国信通院云计算与大数据研究所所长何表示,科技行业的特点是赢者通吃,剩下的企业只能抱团取暖,一起做开源的事情。以移动互联网时代为例。苹果iOS系统出现后,接下来就是Android生态系统的构建,这一幕在AI时代还会重演。
从技术演进的角度来看,大规模模型能力的开源有利于提升行业整体水平。有业内人士认为,多模态是通用人工智能的重要技术演进方向之一,可以将AI从单一的感官语言模型变为“五官全部开放”的多模态模型,蕴含着大模型智能飞跃的巨大可能性。郭盛证券也在一份报告中指出,开源有利于防止大公司垄断,打破商业禁止限制。
随着市场对大模型的选择逐渐从“越大越好”转向“更便宜、更高效、更可定制越好”,开源模式被认为更有可能搅动大模型行业现有的竞争格局。百川智能CEO王小川预测,未来80%的企业会采用开源的大模式,因为闭源不一定能更好的适配产品。致远研究院院长黄铁军也认为,开源正在成为塑造人工智能未来发展的主导力量。经过30多年的发展,开源在中国已经进入了一个新的发展阶段。
微信扫码
QQ扫码
您的IP:10.1.228.218,2025-12-18 17:59:06,Processed in 0.39537 second(s).