豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源
02-10 13:13 星期一
【豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源】视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于Sora 、DALL-E 、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。 目前,该项目代码与模型已开源。
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
相关阅读
业界首个!豆包新模型搅动AI视觉
热门评论
一心听语
回复
5月前·IP未知
1
可以理解为利好AI眼镜吗?