中信建投:Sora有望推动AI应用加速
02-19 09:33 星期一
中信建投

OpenAI Sora将文生视频推向新高度,人工智能理解世界迈出重要一步。文生视频模型在过去的一年中取得巨大的技术进步,扩散模型成为文生视频的主流技术路线。然而文生视频模型的技术升级仍然存在一定痛点:生成视频长度和视频前后帧连贯性不足,造成这些现象的背后原因部分在于高质量的文字视频数据集相对稀缺。2月16日,OpenAI发布全新的Sora文生视频模型,可以一次生成60s的长视频,且视频的画面精细度、流畅度超越了过往的文生视频模型,Sora有时能够模拟对世界状态产生简单影响的行为,将文生视频能力推向了全新的高度。Sora采用扩散模型+Transformer模型,通过一定的数据处理实现了更为广泛的数据集,Sora模型带来的震撼背后是一次数据驱动下的能力突破。基于海量数据训练的Sora模型同样观察到了大语言模型中的涌现现象,Sora能够深度模拟现实世界中人类、动物和环境的物理规律,标志着人工智能在理解真实世界场景并与之互动方面迈出了重大的一步,Sora或成为实现通用人工智能的重要里程碑。

谷歌再度更新Gemini系列模型,大模型竞争再度进入白热化阶段。2月8日,谷歌宣布把 Bard AI 聊天机器人更名为 Gemini,并推出Gemini Ultra 1.0 —— 谷歌大语言模型最大、功能最强大的版本。2月16日,谷歌宣布推出全新的 Gemini Pro 1.5 模型,相比较前代产品 Gemini Pro 1.0, Pro 1.5 新模型在多个方面都取得了长足进步,能够更高效、更长时间地处理信息,可一次性处理大量信息,百万token超长上下文窗口。

ChatGPT诞生之后不断更迭。2月13日OpenAI通过新闻稿宣布,当前正在小范围测试ChatGPT的“记忆”功能:记住用户在聊天中讨论过的事情,并避免重复信息。基于过往内容逐步构建记忆,提升未来交流效率。2月17日,OpenAI在社交平台宣布,取消了GPT-4 Turbo的所有每日限制,并将速率限制提升1倍。现在,每分钟可处理高达150万TPM的数据。自ChatGPT上线之后,OpenAI仍然在不断对其进行持续升级,近日为其增加记忆能力同时移除API每日限制,GPT正在从能力卓越的基础模型进一步成长为AI生态的坚定基石。

风险提示:大模型技术发展不及预期、商业化落地不及预期、政策监管力度不及预期、数据数量与数据质量不及预期等。

财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
发条魔人回复1年前·IP未知0
一地脚毛挂起了风