3月6日凌晨,阿里正式发布了全新的开源推理模型——通义千问QwQ-32B。这款模型拥有320亿参数,尽管参数量远少于DeepSeek-R1的6710亿参数(其中370亿被激活),但在性能上却能与之媲美。通过大规模强化学习的应用,通义千问QwQ-32B在数学、编程以及通用能力方面实现了显著提升,整体表现不输DeepSeek-R1。更重要的是,该模型大幅降低了部署成本,即使在消费级显卡上也能顺利运行。
通义千问QwQ-32B开源详情
阿里已选择Apache2.0协议将通义千问QwQ-32B模型开源,这意味着任何人都可以免费下载并用于商业用途。用户还可以通过通义APP免费体验这一先进模型。阿里通义团队透露,他们将继续致力于智能体与强化学习的结合研究,力求实现更长时间的推理能力,探索更高层次的人工智能,最终迈向AGI(通用人工智能)。
全球AI开源社区的认可
3月6日晚,全球最大的AI开源平台Hugging Face更新了其大模型排行榜,通义千问QwQ-32B荣登榜首。与此同时,腾讯也推出了其开源项目——混元图生视频模型。此模型能够根据用户提供的图片和简单描述,生成5秒的短视频,并自动添加背景音效。此外,它还支持“对口型”和“动作驱动”功能,允许用户上传人物照片并输入文本或音频,使图片中的人物仿佛在说话或表演舞蹈。
混元图生视频模型的特点
混元图生视频模型总参数量为130亿,适用于多种角色和场景,如真实视频创作、动漫角色乃至CGI角色的生成。此次开源不仅包含了模型权重和推理代码,还包括了LoRA训练代码,便于开发者训练定制化的LoRA等衍生模型。目前,该模型已在多个主流开发者平台上提供下载。
开源共享的重要性
值得注意的是,这两款模型均为国产开源项目。3月4日,十四届全国人大三次会议发言人娄勤俭强调,开源共享促进了全球范围内的人工智能技术发展,体现了中国的智慧贡献。这些开源项目的推出,无疑将进一步推动人工智能领域的创新与发展。
© 版权声明
文章版权归作者所有,未经允许请勿转载。