大型模型信息:
Qwen-VL,阿里云开源多模态模型
阿里云今天宣布推出开源大规模视觉语言模型Qwen-VL。Qwen-VL是基于70亿参数模型Qwen-7B开发的,支持图形输入,具有理解多模态信息的能力。
Qwen-VL是一个视觉语言(VL)模型,支持多种语言,如中文和英文。与之前的VL模型相比,Qwen-VL不仅具备图形识别、描述、问答、对话等基本能力,还具备视觉定位、图像中文本理解等能力。
在主流的多模态任务评估和多模态聊天能力评估中,Qwen-VL取得了远超同量表一般模型的表现。

IBM将参与Hugging Face的2.35亿美元D轮融资。
IBM和开源人工智能平台Hugging Face周四联合宣布,前者参与了后者的2.35亿美元D轮融资。
这笔额外的资金将进一步加强Hugging Face作为领先的开源和开放科学人工智能平台的地位。IBM和Hugging Face最近宣布在IBM的生成式人工智能平台watsonx上进行合作,帮助企业跨多个领域构建、部署和定制基础模型。
在watsonx中,人工智能构建者可以使用IBM和拥抱脸社区的模型,这些模型可以在预训练后支持一系列自然语言处理(NLP)任务,包括问题回答、内容生成和摘要、文本分类和提取。
AMD收购AI软件公司Mipsology将加强AMD的AI软件开发能力。
据AMD官网消息,AMD宣布收购AI软件公司Mipsology。
AMD表示,Mipsology的软件团队将加入AMD AI集团,帮助进一步加速AMD的客户参与,并扩展AMD的AI软件开发能力。该团队将帮助开发AMD完整的人工智能软件栈,扩展AMD软件工具、库和模型的开放生态系统,并为运行在AMD硬件上的人工智能模型的简化部署铺平道路。
Mipsology成立于2015年,总部位于法国巴勒莫。该公司主要开发领先的AI推理和优化解决方案以及为AMD硬件量身定制的工具。
微软团队推出字样AI工具,加强品牌营销内容。
微软最近宣布将为微软团队加入AI工具字样。
据悉,Typeface整合了Azure机器学习、Azure OpenAI服务和Typeface品牌个性化AI的强大能力,可用于创建创意简报、电子邮件营销活动和多媒体在线广告。用户无需切换应用即可提升品牌内容。企业可以使用Affinity AI模式来训练字样AI应用,并创建自己的专属内容。
Meta AI发布开源基本模型代码Llama,专门做代码生成。
Meta AI最近发表了一篇论文,公布了一个代码生成功能的基础大型语言模型代码Llama。
据悉,Code Llama是基于Llama 2开发的,具有领先的性能、填充能力、对大输入上下文的支持以及开放模型中编程任务的零指令跟随能力。它提供了包括基本模型、Python特殊版本和指令跟随模型在内的几个模型,每个模型的参数分别为7B、13B和34B。所有模型都是在16k标签序列的基础上训练的,并且在最多100k标签的输入上表现出改进。
Code Llama是一个开放源码的松散许可,允许研究和商业使用。
启安信发布Q-GPT安保机器人和大模型卫士。
长安新集团在京发布Q-GPT(长安新大模型)安全机器人和大模型卫士。
据报道,Q-GPT安全机器人是基于Chianxin big模型的“虚拟安全专家”,可以全天候工作。大模型卫士集成了安全风险发现、大模型访问控制、数据泄露控制、违法行为追溯等功能。
会上,京东集团、吉利集团等客户现场签约,成为国内首批Q-GPT安全机器人和安全模范用户。
关键论文:
中科大联手新加坡管理大学推出图像生成模型CgT-GAN。
据Arxiv页面报道,中国科技大学和新加坡管理大学近日发布了一个图像生成模型CgT-Gan。
CgT-GAN通过将图像纳入训练过程,使模型能够“看到”真实的视觉模式。具体来说,研究团队利用对抗训练教会CgT-GAN模型模仿外部文本语料库中的短语,同时利用基于CLIP的奖励机制提供语义指导。
实验结果表明,CgT-GAN在各项指标上明显优于现有方法。
论文地址:点击此处前往。
微信扫码
QQ扫码
您的IP:10.1.228.218,2025-12-19 03:24:55,Processed in 0.40504 second(s).