微软亚洲研究院开发的一种前沿人工智能技术,VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。
由字节跳动ai研究人员推出的MagicVideo-V2,在文本转视频生成领域脱颖而出。它将文本到图像模型、视频运动发生器、参考图像嵌入模块和帧插值模块集成到端到端视频生成管道中。这种结构使 MagicVideo-V2 能够制作高分辨率、美观的视频,并具有出色的保真度和流畅度。它明显优于其他领先的文本到视频系统,例如 Runway、Pika 1.0、Morph、Moon Valley 和 Stable Video Diffusion 模型
Mistral AI发布了拥有1240亿参数的Pixtral Large模型,能处理文本和图片,理解文档、图表和自然图像,在多模态基准测试中表现出色。其聊天机器人Le Chat引入了Pixtral Large,强化了数学推理和图像生成能力,并支持任务代理、文档/图像分析、图像生成及网络搜索功能
基于Transformer架构的深度优化,能够在较少资源下实现高效计算。公司专注于为企业提供定制化解决方案,通过API将强大的语言模型嵌入到企业内部系统中,满足企业在文档搜索、文本生成、内容摘要等多种场景中的需求。
文本和图像快速生成高质量的逼真视频
新一代认知智能大模型,专注于做大模型的中国创新
OpenAI旗下美国图像生成系统
Open AI视频生成模型
聊天机器人程序
高性能语言模型
微软亚洲研究院开发的一种前沿人工智能技术,VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。