ChatGPT问世半年多以来,全球科技公司都在争相开发大模型,大模型走向开源的趋势几乎已成定局。随着越来越多的大型模型开源,也会对目前处于行业领先地位的OpenAI造成压力。
此前,大模型的“主导权”集中在几家大型科技公司手中,开源社区在过去几个月进行了强势反击。包括Meta的Llama2在内的项目试图挑战大型科技公司建立的整个商业模式。
在中国,像阿里这样的大公司也加入了开源大军。上周,国内AI开发者社区“ModelScope”上架了阿里巴巴的两款开源模型,Qwen-7B和Qwen-7B-Chat,分别是阿里云的70亿参数通用模型和对话模型。这两种模型都是开源的、免费的和商业可用的。
阿里云表示,开源的大模型可以帮助用户简化模型训练和部署的过程。用户不必从零开始训练模型,只需下载预先训练好的模型并进行微调,就能快速构建出高质量的模型。
百川智能CEO王小川预测,未来80%的企业会使用大开源模式,因为闭源不一定能更好的适配产品,或者成本特别高,闭源可以为剩下的20%提供服务。“两者在不同的产品上是互补的。”王小川说。
“开源军团”来了。
今年4月,美国软件公司Databricks发布了Dolly 2.0,成为业内第一个开源并遵循指令的大型模型。它在一个透明和免费的数据集上进行了微调,该数据集也是开源的,可以用于商业目的。
随后,Meta在7月中旬发布了开源商业版人工智能模型Llama 2,这意味着大型模型应用对大量开发者来说进入了“免费时代”,创业公司也可以低价打造类似ChatGPT的聊天机器人。
猎豹移动创始人兼董事长傅盛随即在社交媒体公开表示:“大模式不再高不可攀,平民大模式时代已经到来!像我们这样的公司会在深夜笑醒。”
作为聊天机器人等人工智能工具的基础,大模型的开源会减少自己版本ChatGPT的开发。Meta将开源Llama 2,这意味着企业可以接入Llama 2模型,通过优化创建自己的类似于ChatGPT或Google Bard聊天机器人的产品。
国内,企业也在加速。阿里云是开源的,开源的机型主要是Qwen-7B和Qwen-7B-Chat。
其中Qwen-7B是支持中英文的基础机型。在超过2万亿的token数据集上进行训练,上下文窗口长度达到8k。Qwen-7B-Chat是一个基于基座模型的中英对话模型,已经与人类认知对齐。开源代码支持量化Qwen-7B和Qwen-7B-Chat,支持用户在消费级显卡上部署和运行模型。用户可以直接从魔术社区下载模型,也可以通过阿里云纪灵平台访问和调用Qwen-7B和Qwen-7B-Chat。
同时,阿里云透露,依桐钱文7B的预训练模型在多个权威基准测试中表现出色。在英语能力基准MMLU上,依桐钱文7B模型的得分超过了多个主流开源模型7B、12B和13B。该基准包含57个学科的英语题目,测试人文、社会科学、理工科等领域的综合知识和解题能力。在中文常识能力基准C-Eval上,依桐·钱文在验证集和测试集上都取得了高分,在GSM8K、HumanEval等数学问题解决能力评价基准中也表现不俗。
蓝印科技创始人兼CEO周明对第一财经记者表示:“开源和闭源之争可能会再次上演。Meta,这些公司发布了商业化水平不错的开源模型,可能会对一些公司的闭源模型或者一些团队的‘自研模型’造成很大压力。”
在过去的几年里,科技巨头似乎可以垄断不断增长的大型语言模型市场。他们选择关闭模型来源,构建自己的“护城河”,很少公开技术进展。
然而,随着大模型的激烈竞争,这些科技巨头已经明显感受到了来自开源社区的压力。市场对大机型的选择,正逐渐从“越大越好”转向“越便宜越好”、“越高效越好”、“越定制越好”。

一些分析师表示,开源模式可能会削弱ChatGPT开发商OpenAI和Google Big Model目前的市场主导地位,OpenAI的GPT和Google Bard Big Model向用户收取昂贵的费用。
由于封闭源代码的模式,只有源代码所有者有修改代码的权力,其他人拿不到“手稿”,只能从软件开发者那里购买成品。
根据Fast Company的预测,OpenAI今年的收入有望达到2亿美元,包括向开发者提供API数据接口服务和聊天机器人的订阅服务费。一旦大模型开源,任何人都可以公开获取模型源代码,在版权限制范围内修改甚至二次开发。这意味着大模型开源后会吸引更多的开发者,大模型的应用也会更加丰富。
例如,在Llama2宣布开源后不久,人工智能初创公司Stability AI已经迅速微调了一个名为FreeWilly的模型,并表示其性能与ChatGPT相当。
大模型的护城河在哪里?
谷歌近日泄露的一份内部文件显示,由于开源模式的进步,大型科技公司的市场份额并不像看上去那么稳定。谷歌的文件说:“我们没有护城河,OpenAI也没有。”
随着大型模型的重点转移到创建更大的模型,研究和创新的成本急剧上升。像GPT-3这样的模型需要数百万美元来训练和运行。所以大模型的工作仅限于少数有足够经济实力的公司和相关的人工智能实验室。
大模型的关键“护城河”包括:训练中使用的数据、模型的权重以及训练和推理的成本。大型技术公司在培训和推理成本方面具有优势,因为它们是唯一能够支付培训和运营大型模型基础设施的公司。小公司用不起昂贵的GPU,甚至租用云计算能力都很贵。
为了在数据和模型权重上获得优势,一些科技公司选择闭源。OpenAI大概是最有代表性的例子。在OpenAI的早期,它曾经是一个公布所有研究成果的人工智能实验室,但现在,该公司已经发展成为一家出售其大型模型API访问权限的创业公司,甚至不再公布其训练数据和模型架构的详细信息。
这也是马斯克批评OpenAI“违背初衷”的关键因素。尤其是在微软向OpenAI追加数十亿美元后,马斯克认为OpenAI的技术已经完全被微软掌控,不利于行业的共同繁荣。
随着Meta、阿里巴巴等更多企业逐渐开源大模型,未来会有更多的闭源模型被迫开源。
这些GPT大模型的开源替代方案对开发者意味着什么?一位大模型开发者对第一财经记者表示:“首先,即使大模型的参数不够大,但如果在非常大的数据集上训练模型,在性能上可以和参数非常大的模型相抗衡;其次,一些小企业可以用少量的预算和适当的数据将小模型微调到与大模型相当的水平。”
他还表示,由于开源模式支持不同的团队在彼此的工作基础上进行构建,因此开源模式的进展速度要比封闭的生态系统快得多。
而王小川则认为开源确实容易“塑造性格”,会吸引更多的朋友参与到大模型的开发和改进中,加速创新,降低用户的使用门槛和成本。同时开源也可以为商业化做准备。如果你对它感觉良好,当你需要更好的服务和更大的参数时,可以探索进一步的商业化路径。
Meta AI科学家刘鑫不久前也对媒体表示,Meta的大模型和OpenAI的想法不太一样。“OpenAI是一个相对封闭的模型,但我们相信开源。”他表示,尤其是那些中小企业,他们没有足够的能力和资本去训练一个大的模型,但是通过开源,可以利用Llama2,结合公司自身的数据和具体的应用场景进行相关优化。
同时,他认为大模特行业远非某一家公司所垄断或独占。每个公司,每个人都有很多事情要做,无论是培训,加速自己的技术还是处理数据,应用水平等等。
外部创新会削弱大厂的价值。
更多的开源模型可以为希望在应用程序中使用大型模型的企业提供替代方案。这对大型科技公司意味着什么?
谷歌备忘录警告说:“现在大模型的尖端研究是负担得起的,保持技术竞争优势将变得更加困难。全世界的研究机构都在彼此工作的基础上探索解决方案,这远远超出了我们自己的能力。我们可以努力保守秘密,但外部创新会削弱它们的价值。”
但随之而来的问题是,相应的监管和商业化将成为一个难题。因此,企业在选择开源或闭源模式时,要综合考虑公司的经营策略等因素。
“我认为,大厂商最终会走向开源模式,因为他们希望吸引开发者社区,而在对外形象方面,如果他们一直不开源,就会导致人才流失。”一位人工智能领域的顶级专家告诉第一财经记者。他的团队也在基于Llama2对模型进行微调。
他还表示,OpenAI也可以选择一直不开源,但前提是其模型必须保持绝对的技术领先。“目前来看,GPT4仍有其明显的优势,但未来是否会被超越还很难说。”他说。
虽然开源模型的问世无疑将打破大型科技公司对大模型的垄断,但业内人士认为,开源大模型并不适合所有人,尤其是那些内部没有机器学习人才,希望通过一些API调用将大模型快速整合到应用中的公司。开源对他们没有吸引力,这也意味着基于云的大模型市场不会消失。
周明说,选择开源模式可以节省大量的基础培训成本。但他提醒,如果要用开源,要看开源能否支持大数据和计算能力,或者开源能否支持内部商业化。
开源中国董事长马跃在今年7月接受第一财经记者采访时也表示,开源可以降低使用AI大模型的门槛。美国有一家开源的AI模型托管公司Huggingface,只有100多人,估值20亿美元。到今年6月,它已经收集了26万个大型开源模型和数据集。
“对于企业来说,只有专属的数据培训才有价值。你可以整理自己的专属数据,然后用开源的模型来训练,得到自己企业的AI模型。”马跃表示,在这个过程中,开源AI模型托管公司可以分配计算能力,以降低企业训练数据的成本。
马跃表示,现在国内科技巨头之间“百家争鸣”,普通企业很难获得计算能力。预计两三年内中国只有一两个AI模型胜出。一些地方政府拥有计算能力,希望更多企业能够享受到AI模式的好处。
“开源是一种商业模式。重要的不仅仅是流量,最核心的生命力是用户反馈和传播。”马跃说。
大观数据CEO陈对第一财经记者表示,开源大模式的生态系统建设还处于早期阶段。生态也是包括谷歌、微软在内的科技巨头的关键“护城河”。这些公司拥有非常丰富的上下游生态和销售渠道。
大型科技公司最近的财报电话会议表明,他们已经能够通过人工智能获得巨额利润。微软的表现表明,该公司通过其人工智能服务创造了价值数十亿美元的业务,包括通过Azure OpenAI服务和OpenAI在其云基础设施上运行的工作负载。
“我觉得开源生态需要时间来逐步培养。就像安卓系统刚出来,需要上游手机设备厂商、下游APP开发者等生态链的培育,才能形成竞争力和一条‘护城河’。陈告诉第一财经记者。
微信扫码
QQ扫码
您的IP:10.1.228.218,2025-12-19 15:09:44,Processed in 0.26423 second(s).