直接生成16秒高清视频 我国自研视频大模型在京发布

未结 0 12
聚合新闻
聚合新闻 会员 4月28日 12:14 发表
<p class="otitle">(原标题:直接生成16秒高清视频 我国自研视频大模型在京发布)</p> <p><style> #endText .video-info a{text-decoration:none;color: #000;} #endText .video-info a:hover{color:#d34747;} #endText .video-list li{overflow:hidden;float: left; list-style:none; width: 132px;height: 118px; position: relative;margin:8px 3px 0px 0px;} #entText .video-list a,#endText .video-list a:visited{text-decoration:none;color:#fff;} #endText .video-list .overlay{text-align: left; padding: 0px 6px; background-color: #313131; font-size: 12px; width: 120px; position: absolute; bottom: 0px; left: 0px; height: 26px; line-height: 26px; overflow: hidden;color: #fff; } #endText .video-list .on{border-bottom: 8px solid #c4282b;} #endText .video-list .play{width: 20px; height: 20px; background:url(http://static.ws.126.net/video/img14/zhuzhan/play.png);position: absolute;right: 12px; top: 62px;opacity: 0.7; color:#fff;filter:alpha(opacity=70); _background: none; _filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png"); } #endText .video-list a:hover .play{opacity: 1;filter:alpha(opacity=100);_filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png");} </style> <script src="https://static.ws.126.net/163/f2e/libs/hls.min.js"></script></p> <div class="video-wrapper" style="margin: 10px auto;background: #F5F5F5;"> <div class="video-inner" style="padding: 25px;padding-bottom:20px;"> <div class="video" style="height: 435px; background: #000;"> <video id="VKVUJG0BM" preload="true" controlslist="nodownload" width="100%" height="100%" controls="controls" style="object-fit: contain;" poster="http://videoimg.ws.126.net/cover/20240428/b3ICLlXqG_cover.jpg" data-vid="VKVUJG0BM" alt="直接生成16秒高清视频 我国自研视频大模型在京发布"></video> </div> <script> if(Hls && Hls.isSupported()) { var hls = new Hls(); hls.loadSource("https://flv0.bn.netease.com/1228e2d84b58665f44e4680d6f4785b37a10573ecd62c1b550f1c9138310de37ae7bfc57e96df01d4ed7b463863802f5df5e2c6a651b05cdfba75dec795a7eb661c83b56635ab2186a9ff5762e1684cacf0140065f514c6ea6369497b7479b97e1acf80f1a5f2c60681956c186dbf2b1e6001dd29e709f44.m3u8") hls.attachMedia(document.getElementById("VKVUJG0BM")) } </script> <div class="video-info clearfix" style="margin: 16px 0 0px 0px;height:20px;line-height:20px;"> <p class="fn-right" style="height: 22px;line-height: 22px;overflow: hidden;font-size:12px;float: right; margin:0;padding:0;text-indent:0;"><a style="text-align: right;float: left;width: 300px;" href="https://www.163.com/v/video/VKVUJG0BM.html" target="_blank" class="video-title">直接生成16秒高清视频 我国自研视频大模型在京发布</a> <span class="video-from" style="color: #a7a7a7;margin-left:10px">(来源:新华社新闻)</span></p> </div> <div class="video-list"> <ul class="clearfix" style="margin:0;padding:0;list-style:none;width:540px;"> </ul> </div> </div> </div> <p></p> <p>新华社北京4月27日电(记者魏梦佳)只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。</p> <p><!--StartFragment--></p> <p>记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。</p> <p>清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。</p> <p>在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。</p> <p>“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。</p> <p>此外,Vidu还可生成如熊猫、龙等形象。</p> <p>据悉,Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型,我们相信,Vidu未来能支持生成更加多样化、更长时长的视频内容,探索不同的生成任务,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。”朱军说。</p> <p><!--EndFragment--></p> <div style="height: 0px;overflow:hidden;"><img src="https://static.ws.126.net/163/f2e/product/post_nodejs/static/logo.png" referrerpolicy="no-referrer"> </div>
收藏(0)  分享
相关标签: 新闻
注意:本文归作者所有,未经作者允许,不得转载
0个回复
  • 消灭零回复