收藏文章 楼主

上下文数据(上下文参数是什么)

版块:科技头条   类型:普通   作者:科技资讯   查看:49   回复:0   获赞:0   时间:2023-08-10 16:08:04

现在,代码完成模型领域又出现了一股“新生力量”。

近日,开放了稳定扩散源头的Stable发布了新的大模型——Stable code,这是其首个用于编码的生成式AI大模型。Stable将其描述为“革命性的”。

据介绍,StableCode旨在帮助程序员处理日常工作,同时为开发新手提供了一个很好的学习工具,让他们通过上一层楼梯来掌握技能。

官方博客地址:https://stability . ai/blog/stable code-LLM-generative-ai-coding。

对于StableCode,网友期望很高,表示确实需要将整个代码库作为上下文的大代码模型。

三个版本:基本、指令和长上下文窗口模型。

StableCode通过三个不同版本的模型帮助开发者变得更加高效。基本模型是“稳定码-补全-alpha-3b-4k”,这是一个仅使用解码器的30亿参数码补全模型。

基础模型已经在BigCode stack数据集的各种编程语言上进行了预训练,在Python、Go、Java、Javascript、C、markdown、C++等流行编程语言上进行了针对性的训练。总体而言,StableCode在HPC集群上训练了5600亿个令牌码。

BigCode here是2022年9月由HuggingFace和ServiceNow Research联合发起的大代码模型项目,旨在围绕AI代码生成工具建立开放社区,开发大语言模型代码。

hugging face:https://hugging face . co/stability ai/stable code-completion-alpha-3 b-4k

在基本模型的基础上,针对具体用例调整的指令模型“稳定代码-指令-alpha-3b”有助于解决复杂的编程任务。该模型也是一个仅使用解码器的30亿参数指令调整代码模型,并已在stackoverflow开发者调查报告中对顶级编程语言进行了预训练。

同时,在基本模型上训练了大约12万个羊驼格式的代码指令-响应对。下图显示了使用StableCode指令模型为给定指令生成响应的代码示例。

Huggingface地址:https://hugging face . co/stabilizai/stable code-instruct-alpha-3b。

对于那些想要学习更多编码技能的人来说,StableCode是一个理想的构建块。长上下文窗口模型“StableCode-Completion-Alpha-3B”堪称完美助手,保证用户可以使用单行和多行自动代码完成建议。

这个模型也是一个仅使用解码器的30亿参数代码完成模型,它在2023年stackoverflow开发者调查报告中使用最多的编程语言上进行了预训练。

与之前发布的开源模型相比,该模型的上下文窗口达到16000 token(比其他任何模型都大),一次可以处理更多的代码,是之前模型的2-4倍。这允许用户查看或编辑五个中等大小的Python文件,使其成为新手的理想学习工具。

如下图所示,StableCode利用Pytorch深度学习库完成了一个复杂的Python文件,其中格雷码是StableCode的预测结果。

拥抱脸地址:https://hugingface.co/stabilizai/stable代码-完成-阿尔法-3b。

同级别模型对比结果

下表显示了StableCode模型的三个版本的基准分数。

StableCode还与参数数量和token数量相近的同级别模型(30亿个参数)进行了对比,其中pass@1和pass@10指标在流行的HumanEval基准上使用。

从下图可以看出,对比replit-coder(引入AI编程独角兽replit)和starcoderbase,StableCode的pass@1强于Replit-Coder,弱于starcoderbase,强于pass@10。

原文链接:https://stability . ai/blog/stable code-LLM-generative-ai-coding。

剧终

授权请联系本微信官方账号。

投稿或寻求报道:content@jiqizhixin.com。

 
回复列表
默认   热门   正序   倒序

回复:上下文数据(上下文参数是什么)

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:10.8.251.137,2025-12-17 17:43:28,Processed in 0.18536 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com