收藏文章 楼主

大厂模型商用开源,阿里云起了个头

版块:科技头条   类型:普通   作者:科技资讯   查看:35   回复:0   获赞:0   时间:2023-08-06 07:17:34


看来开源的力量势不可挡。


8月3日,通义千问70亿参数通用模型和对话模型(简称Qwen-7B和Qwen-7B-Chat)出现在AI模型社区魔搭ModelScope上,两款模型均开源、免费、可商用。


由此,阿里云成为国内大厂中第一个开源大模型的企业。


Qwen-7B是支持中、英等多种语言的基座模型,Qwen-7B-Chat是基于基座模型的中英文对话模型,在许多测基准,比如MMLU、C-Eval 中,Qwen-7B在70亿参数规模领域上都取得了良好的表现,阿里云表示其部分能力甚至可以赶超一些120亿参数大模型。


用户目前已经可以从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用这些模型,而通过开源代码,用户可以很方便地在消费级显卡上部署和运行模型。阿里云基于大模型的服务,包括训练、推理、部署和精调都可以应用在上述两个模型上。


这不是国内第一个免费、可商用的大模型。就在半个月前,智谱 AI 宣布 ChatGLM-6B 和 ChatGLM2-6B 允许免费商业使用,百川智能的Baichuan 13B模型在发布的同时就开源允许免费商用。


但通义千问是成为了第一个科技大厂的开源大模型,它的开源将被视为国内“百模大战”进入新阶段的一个标志——现在无论中美,也无论巨头还是中小初创公司,有关大模型开源的看法正在趋近于一致。


在Meta宣布开源LLaMA 2 的时候,Meta 首席科学家、图灵奖获得者 Yann LeCun就宣称,大模型行业的竞争格局将会改变。这是因为闭源依靠大力出奇迹的方式证明了大模型路线的可性能和极限,而开源则会通过繁荣的生态,让大模型变得真正可用、易用。


换而言之,大模型本身的神秘光环正在逐渐消褪。当技术不再难以逾越,繁荣的开源生态以及由此带来的群策群力的技术迭代和突破就成为了新的护城河。在7月举办的世界人工智能大会上,阿里云将促进中国大模型生态的繁荣作为自己的首要目标。


为此,阿里云打出了一套组合拳。


比如阿里云的灵积模型服务平台,它提供了一系列自动化的模型上云工具链路,让模型不仅能通过推理API被集成,也能通过训练微调API实现模型定制化。另外,去年推出的AI模型社区魔搭,已经聚集了20多家顶尖人工智能机构贡献的1000多款开源模型。它们彼此的部署链路是打通的,也就是说来自社区的模型可以通过灵积实现服务化——这看上去就像是个起步阶段的模型自由市场,它能够实现,当然是开源的功劳。


而任何市场都需要充分的竞争,归根结底,阿里云想要通过降低门槛来让开源大模型生态繁荣起来,就需要提供足够丰富、足够高质量的开源大模型参与其中。


通义千问的开源势在必行。


由此,千帆竞渡的百模大战,现在已经进入到了真刀真枪贴身肉搏环节——模型究竟好不好,不是靠吹出来的,开源到社区里,群众自会检验。


欢迎来到自由的大模型开放世界。

 
回复列表
默认   热门   正序   倒序

回复:大厂模型商用开源,阿里云起了个头

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:10.3.134.11,2025-09-22 13:36:05,Processed in 0.26979 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com