腾讯发布混元图像2.0 实现实时图片生成与多模态创新突破

访客 2025-05-17 15:13:02 10875 抢沙发

默认

【太平洋科技快讯】5月16日，腾讯正式推出新一代AI图像生成模型——混元图像2.0（Hunyuan Image 2.0），并在腾讯混元官方网站上线，面向公众开放注册体验。

凭借超高压缩倍率的图像编解码器和全新的扩散架构，混元图像2.0在参数量上较前代提升了整整一个数量级，生图速度更是实现了指数级飞跃。相较于市面上同类商业产品每张图片需耗时5到10秒进行推理运算，混元图像2.0能够实现毫秒级响应。这意味着用户可以一边输入文字指令或通过语音控制，一边实时见证图像生成的过程，彻底告别传统“抽卡—等待—抽卡”的低效模式。

混元图像2.0引入了强化学习算法，并与大量人类美学知识进行了深度对齐，从而显著提升了生成图像的质量。其输出效果不仅更加细腻逼真，还有效避免了传统AIGC图像中常见的“AI味”。根据GenEval（Geneval Bench）评测结果，混元图像2.0的准确率超过95%，远超其他同类模型，成为当前图像生成领域的标杆之作。

值得一提的是，混元图像2.0还推出了创新的实时绘画板功能。这一功能基于模型强大的实时生图能力，允许用户在绘制线稿或调整参数的同时，即时预览上色效果，彻底颠覆了传统“绘制—等待—修改”的线性创作流程。此外，实时绘画板支持多图融合技术，用户可上传多个草图，AI将自动协调透视与光影关系，并依据提示词内容生成高度一致的融合图像。不仅如此，混元图像2.0还支持语音输入，系统会将用户的语音指令快速转写为文字，并即时生成对应图像，进一步降低了创作门槛，让每个人都能轻松成为“数字艺术家”。

结语

作为腾讯在AIGC领域的一次重要突破，混元图像2.0不仅展现了强大的技术实力，更以极高的实用性和创新性重新定义了图像生成的可能性。无论是专业设计师还是普通用户，都可以通过这款工具感受到AI技术带来的无限可能。未来，随着更多应用场景的开发和技术的持续优化，混元图像2.0有望成为推动创意产业变革的重要力量。

标签：图像模型实时