Kaiyun - 中国权威官方网站

『新闻大全』

助力打造更强AI视频模型 火山引擎发布大模型训练视频预处理方案

2024-10-16  

  火山引擎10月15日发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。

  火山引擎总裁谭待表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长层面为企业寻找解法。

  据介绍,对训练视频进行预处理是保障大模型训练效果的重要前提。预处理过程可以统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息,从而使模型能更高效地学习视频中的特征和知识,提升训练效果和效率。

  抖音集团视频架构负责人王悦表示,对大模型厂商而言,在上述过程中面临着诸多挑战。首先,超大规模视频训练数据集导致计算和处理成本激增,其次是视频样本数据参差不齐,然后是处理链路环节多、工程复杂,最后还面临着对GPU、CPU、ARM等多种异构算力资源调度部署的难题。

  火山引擎此次发布的大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本,支持端侧大模型接入和算子加速,更加轻量、通用。

  Bytedance Research负责人李航介绍,豆包视频生成模型PixelDance在训练过程中采用了火山引擎的大模型训练视频预处理方案,充分利用了大量潮汐资源,为模型训练提供了有力支撑。火山引擎视频云团队提供的点播解决方案还为PixelDance生产的视频提供了从编辑、上传、转码、分发、播放的全生命周期一站式服务,让模型的商业化应用有了保障。

  据了解,豆包视频生成模型PixelDance于9月24日发布,该模型采用DiT架构,通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,突破了多主体运动的复杂交互、多镜头切换的内容一致性等难题。目前,豆包视频生成模型已通过火山引擎面向企业开启邀测。

  与此同时,火山引擎还发布了跨语言同声复刻直播方案、多模态视频理解与生成方案、对话式AI实时交互方案和AIG3D&大场景重建方案,从视频的生产端、交互端到消费端,全链路融入了AI能力。

  以对话式AI实时交互方案为例,依托豆包大模型和火山引擎视频云自研的多项算法,火山引擎为用户提供了智能对话和自然语言处理的强大能力,可实现毫秒级人声检测和打断响应,以及丝滑稳定的“端到端”响应体验。

  在沉浸式消费体验方面,火山引擎通过AI生成3D内容和大场景重建方案,为山西高平二郎庙金代戏台和北京正乙祠两座珍贵的历史建筑生成了3D数字资产,并以虚拟直播间的形式应用于抖音的戏曲直播场景。

  大会上,王悦还透露了字节自研视频编解码芯片的最新进展,经过抖音集团内部的实践验证,该芯片在同等视频压缩效率下,成本节省了95%以上,还在2024MSU世界编码器大赛中一举夺得最佳ASIC编码器。该芯片将于近期正式对外开放测试,招募首批种子用户,共同探索商业价值的可复制性。(记者 李志勇)Kaiyun中国

上一篇:坚持“五个驱动” 加快培育智能建造新质生产力
上一篇:北京达佳互联取得风格转换模型及虚拟建筑检测模型训练方法专利

猜你喜欢

  • 晚点独家丨比亚迪成立先进技术研发中心加码 AI、大模型投入

    晚点独家丨比亚迪成立先进技术研发中心加码 AI、大模型投入

      我们独家获悉,比亚迪已成立先进技术研发中心,包括 AI 实验室、AI 超算开发部、大数据平台部等,主攻 AI 算法、AI 基础设施、大模型等技术及平台,任务是为智能驾驶、kaiyun中国网页版登录智能座舱、双模(Dual Mode,DM 技术)等比亚迪集团业务提供算力、技术支持。  这一中心成立于 9 月底,目前约...
  • 1958年看到人民大会堂的建筑模型和朱老总的反应不一样

    1958年看到人民大会堂的建筑模型和朱老总的反应不一样

      人民大会堂的设计模型被小心翼翼地摆放在的一间会议室里,等待几位重量级人物的审视。  当天晚上,和朱德刚刚从一场文艺晚会的休息间隙抽身出来,就被工作人员带到这间屋子。  新中国成立后,北京作为首都,需要一座具有象征意义的建筑来承载全国人民的期待。1958年,中央决定修建人民大会堂,并要求在1959年国庆之前完工。  ...
  • 合肥水務集團智能建造助力水廠建設

    合肥水務集團智能建造助力水廠建設

      kaiyun中国网页版登录近日,安徽省住房和城鄉建設廳發布了2025年度智能建造與建筑工業化協同發展試點項目名單,合肥水務集團第三水廠深度處理工程項目成功入選。  自開工建設以來,合肥水務集團積極應用智能建造技術,深度融入施工全鏈條各環節,有效保障工程施工質量,提升施工效率。  在管道焊接作業中,引入具備高精度定位...
  • 中国“双奥”场馆设计师李兴钢英国建筑双展开幕

    中国“双奥”场馆设计师李兴钢英国建筑双展开幕

      人民网伦敦3月27日电 (记者许立群)3月26日,应英国皇家建筑师学会邀请,“李兴钢:胜景几何”建筑设计展开幕典礼在英国皇家建筑师学会举行。  李兴钢是中国“双奥”场馆设计师、梁思成建筑奖获得者、中国工程院院士。他因主持设计了国家体育场“鸟巢”(与他人合作)、北京2022年冬奥会延庆赛区“雪游龙”“雪飞燕”等建筑作...
微信

手机扫一扫添加微信