Z 您现在的位置: > 科技 > 阿里通义万相2.1版模型升级:视频图像生成能力显著提升

阿里通义万相2.1版模型升级:视频图像生成能力显著提升

2025-01-10 17:14:35来源:www.luwei123.com发布:二蛋

通义万相2.1版模型升级:视频生成、图像生成能力显著提升

近日,阿里旗下通义万相宣布推出2.1版本的模型升级。此次升级主要针对视频和图像生成两大功能进行了改进和优化。

在视频生成方面,通义万相2.1引入了自研的高效VAE和DiT架构,增强了时空上下文建模能力,并实现了中文文字视频生成功能。该功能在VBench榜单中名列第一。

此外,通义万相2.1还支持中英文视频一键生成艺术字,并提供多种视觉效果选项,如过渡、粒子效果、模拟等。用户可以根据自己的需求选择合适的特效来增强视频的表现力。

同时,在图片生成方面,通义万相2.1采用了IC-LoRA图像生成训练方法,并利用DiT架构来增强文本到图像的上下文能力。通过多张图像的拼接与联合描述,可以实现关联图像间的组合生成,并保持特征稳定连续。

总之,通义万相2.1版模型升级在视频和图像生成领域取得了显著进展,为用户提供了更加优质、多样化的服务。期待通义万相在未来能够带来更多令人惊喜的创新。

本站内容来源于互联网,旨在传递更多信息,并不意味着本站赞同其观点或证实其真实性。若涉及侵权问题,请与我们联系,我们将尽快予以处理

上一篇: 特斯拉董事集体退还薪酬以和解 下一篇: 最后一篇

Copyright © 2017-2024 www.luwei123.com All rights reserved 芦苇下载站 版权所有

备案号:闽ICP备2024036174号-5

芦苇下载站订阅号