收藏文章 楼主

新华社新闻研究所是什么级别,新华社研究院官网

版块:科技头条   类型:普通   作者:科技资讯   查看:44   回复:0   获赞:0   时间:2023-08-14 03:08:35

500个题目,以高等教育对标人类水平,强调对行业和生活的实际价值,严格按照基础能力指数、智商指数、情商指数、工具效率指数四个评价维度设计权重...8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》)。讯飞Spark以总分1013位列国内主流大机型测评第一,并获得四个测评维度智商指数和工具效率指数第一名。报告认为,讯飞星火“在提高工作效率方面优势明显”。

报告指出,拥有七大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力)的讯飞Spark认知模型具有跨领域知识和语言理解能力,能够理解并执行基于自然对话的任务。从海量数据和大规模知识中不断进化,实现从提出、规划到解决问题的全流程闭环。

面对国内大型模型的“涌现”,讯飞星火认知模型从立项到发布再到迭代升级,每个节点都在紧锣密鼓地进行着:5月6日,讯飞星火认知模型发布,在教育、办公、汽车、人机交互、医疗等领域的应用落地;6月9日突破开放问答,迭代升级数学能力。即将到来的8月15日将实现代码能力的重大突破,多模态交互能力的升级;10月24日,ChatGPT进行了基准测试,达到了中文超越、英文对等的水平。

在智商评价方面,报告认为,人类在智商方面仍有明显优势。课题组从常识知识(20%)、逻辑能力(50%)和专业知识(30%)三个方面对大模型进行考量,结果显示讯飞Spark排名第一。

代码能力无疑是讯飞星火“高智商”的底层能力。8月15日,讯飞Spark的代码能力也将大幅升级,相关代码产品也将推出,值得期待。

在提高工作效率方面,报告认为AI为人类提供了强有力的支持,AI的处理速度远超人类。然而,尽管具有高速高效的优势,但人类的智能和想象力在一些复杂的创新任务中仍然发挥着不可替代的作用。该研究小组专注于提高工具效率(50%)和产生创新(50%)。结果显示,讯飞星火以350分排名第一,遥遥领先。

报告称,与2023年6月相比,中国大型号产品取得了显著进步。但与接受过高等教育的人类相比,大模的智商和情商还是有一定差距的。虽然AI和人类在不同领域表现出不同的优势和劣势,但总体来看,AI大模型的发展为提高人类工作和生活的质量和效率带来了重要的积极影响,大模型正在加速走进生活和行业。

 
回复列表
默认   热门   正序   倒序

回复:新华社新闻研究所是什么级别,新华社研究院官网

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:10.1.228.218,2025-12-20 20:48:14,Processed in 0.06538 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com