正文内容 评论(0)
快科技6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。
该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、速度更快、端侧可用。
年初Sora的爆火,让DiT架构受到了业内极大的关注,很多公司和项目也开始复现DiT路线。
而“视界一粟YiSu”则是基于团队自研的视频生成大模型技术,并没有止步于DiT。该团队融合LLM和扩散模型的自研架构,结合各种路线的优势,在多模态融合、训练效率、推理效率、模型效果等方面达到优化,打造视频生成的方案。
此前,该团队曾提出WorldDreamer,是全球第一次以Transformer和LLM(Masked Token路线)为中心的视频生成工作。
此次发布的视频生成大模型,是YiSu-Beta V0.5版本,YiSu大模型正在按照每周一个小版本、每月一个大版本的迭代速度成长进化。未来几个月,在视频时长、可控性、推理速度、运行成本、理解物理世界等方面还将持续迎来大幅度的提升。
据了解,极佳科技核心团队拥有超过十年的AI技术积累。其团队来自清华大学、中科院、中科大等知名院校,累积发表AI顶级论文200余篇,多次获得全球权威AI比赛世界冠军。