收藏文章 楼主

代码生成器推荐,代码生成器代码

版块:科技头条   类型:普通   作者:科技资讯   查看:42   回复:0   获赞:0   时间:2023-08-27 04:06:25

8月26日,根据phind官方消息,研究团队在Phind内部数据集上对CodeLlama-34B和CodeLlama-34B-Python进行微调后,发现这两款机型在HumanEval测试中的通过率已经超过了今年3月的GPT-4。

Code Llama是Meta发布的大型代码生成模型,有7B、13B、34B三种大小,包含基本模型、Python特别版等多个模型。HumanEval测试显示,未经微调的CodeLlama-34B和CodeLlama-34B-Python的通过率分别为48.8%和53.7%。

phind研究团队在包含约80,000个高质量编程问题和解决方案的专有数据集上对这两个模型进行了微调。这个数据集是phind研究团队推出的数据集,其特点是指令-答案对。两个模型都经过了两次训练,训练量达到了16万个例子左右。这次训练没有使用LoRA(大语言低秩适应,一种微调方案),但R&D团队对这两个模型进行了局部微调,采用了两种训练方法:DeepSpeed ZeRO 3和Flash Attention 2。培训用时3小时,用了32个100-80GB GPU。研究团队表示,他们还采用了OpenAI对数据集给出的净化方案,以确保结果是有效的,不包含受污染的例子。

经过测试发现,CodeLlama-34B和CodeLlama-34B-Python经过训练后的通过率分别达到67.6%和69.5%。今年3月,GPT-4的得分为67%。

 
回复列表
默认   热门   正序   倒序

回复:代码生成器推荐,代码生成器代码

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:10.8.251.137,2025-12-17 18:26:14,Processed in 0.41689 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com