“ 疑似使用了AI 生成时刻,请严慎甄别 ”
全球有莫得发现,这行小字有点像 “ 告白仅供参考, 请以什物为准 ” ,如故确切在活命中越来越常见了。
很是是目下的短视频平台。
刷到个小猫视频,口型是 AI 合成的。
刷个西纪行,也能看到 AI 妖精真身。
甚而看一个动画片,画面还老是 AI 合成的。
AI 视频越来越多了。
天然掀翻 AI 视频波涛的 Sora 还在难产,但 AI 视频时间偶而如故悄相关词至。
东吴证券的一份研报里就估量,中国 AI 视频生成的潜在行业空间,可能领有超越 5800 亿元的商场。
但跟着商场按捺火热,行业的一些问题也冉冉暴露到公众视线:
视频化和 AI 如实王人是异日,但像是资本问题、质料问题、协同问题和性能问题,王人萦绕在整个初创企业,大厂们的心头。
就拿资本问题和质料问题为例。
全球王人知谈,目下的生成式大模子很是是视频,等于一个力大飞砖的过程,需要用海量数据进行磨真金不怕火。
而超大鸿沟视频磨真金不怕火数据,又会对算计和处理数据、以及数据本人有着天量需求,随之而来的资本增多是一个天文数字。
GPT-4o 行动一个老款 AI ,开发资本 “ 仅 ” 为 1 亿好意思元,磨真金不怕火资本或者在 7800 万好意思元傍边。
而视频模子的磨真金不怕火资本就更高了,以岁首推出的视频模子 Sora 为例,其磨真金不怕火和推理所需的算力需求,分袂就达到了GPT-4 的 4.5 倍和近 400 倍。。。
除了天价磨真金不怕火资本外,大模子磨真金不怕火样实质料、处理链路复杂,触及多个行动,需要多团队协调;自研 / 第三方, GPU 、 CPU 、 ARM 等多种异构算力资源,又需要天真谐和部署。。。
是以,对不少准备拥抱 AI 视频的公司们来说,当务之急等于思尽目的,解决这些问题,身手更快地进化。
要论玩视频的能手,抖音和火山引擎可就有话说了。
上个月底字节推出的爆火的 PixelDance ,效果那是杠杠的。
咱们那时还写了篇著作专诚给全球唠了遍,就看咱们浅易试用生成的视频效果,就知谈还真有点东西喔。
而在 15 号末端的火山引擎视频云时刻大会上,开场用了定制数字东谈主谭待来和全球换取。
驱逐效果好到,现场参会者们,不少王人认为这是视频抠图。
而这些高质料 AI 产出背后,其实离不开一个叫 BMF 的智能框架。
火山引擎通过和自家大模子团队在里面合作,沿途把海量的视频数据进行预处理。
终末基于火山引擎音视频处理平台和 BMF 框架,在短时刻内分娩了裕如多高质料的视频素材,用于模子的磨真金不怕火,才有了 PixelDance 。
元勋之一的 BMF ,为什么能够作念到这些呢?
咱们用个活命中常见的例子来解说:
一个公司开发大模子就好比你家作念年夜饭。
为了吃上一顿丰盛的年夜饭,你爸爸肃穆买菜、姆妈煮饭、奶奶包饺子、你搬桌椅板凳。。。
整个东谈主王人得有单干,重新忙到尾,可能还得时经常打个电话发个微信互帮互助,终末一算,好家伙,本来吃顿年夜饭还得花这样多钱。
而 BMF 等于火山引擎推出的一个 “ 年夜饭一键全经过套餐 ” ,它提供了一系列的器具和事业,帮你松弛、快捷地准备好年夜饭。
这个套餐重心针对性地解决了咱们前边说到的 4 个行业痛点,进行了相应的治愈。
比如为了解决视频磨真金不怕火数据质料问题,他们掏出了多种算法对视频进行多维度的分析和筛选,作念到了充分精采化的过滤;
支吾性能费事,他们又诳骗 BMF 框架的天真谐和,提前调配好了性能。
这就很是于准备年夜饭一早就作念好了攻略,买菜交给了多多买菜送货上门、煮饭找了五星级大厨专诚掌勺、桌椅板凳安排了专诚的小工打杂。。。
归正等于用了 BMF 这套框架,又方便又清闲又省钱。
处理了企业这边的需求,火山引擎也没忘了全球伙。
如今,全球开荒的算力按捺飞腾,与之而来的等于对视频画质教训的强烈需求。
火山引擎通过先天不足的上风,每天在抖音 / 西瓜等 app ,濒临上亿用户,处理海量视频图片。
赢得了这样丰富的素养之后,火山引擎在 BMF 基础上,千里淀出了一个更安妥平庸用户体质的 “BMF lite” ,杀青了更轻量、更高效、更通用的进化。
比如相较于云霄,在用户端侧,关于功耗,内存相配敏锐,而场景又触及 Android 、 ios 、 PC 等多平台。
于是 BMF-Lite 就重心建筑基于跨平台,资源复用的算法包的框架假想。
浅易说等于融合了各个平台的接口面貌,方便集成部署。
再用算法限度器来复用同样的算法实例,在抖音播放场景,点播跟直播播放大部分王人是只会收效一个,不错最猛进程地复用资源。
而除了 BMF 为代表的智能框架,火山引擎还提议了智能算力和智能编解码。
火山引擎奏凯在客岁掏出了一款自研视频转码芯片,将自研的视频编解码时刻融入到了里面。
公正等于,针对视频点播、直播等特定场景,这款转码芯片有着更高的算计密度。
就这样说吧,一套视频编解码芯片事业器的转码才略,很是于上百台 CPU 事业器。
今天视频转码芯片上线抖音后,通过扩凑数据标明,在同等视频压缩遵守下,资本能知人善任 95% 以上。
而针对编解码层,火山引擎推出了基于自研视频转码芯片构建的 “BVE1.2 编码器 ” 。
这个编码器勇猛交融了深度学习时刻,推出了翻新性的智能搀杂编解码解决决议,将传统压缩时刻与深度学习压缩时刻有机交融成为一个举座,极地面教训了编解码的遵守,教训了编码性能。
在前不久末端的的第六届深度学习图像压缩挑战赛( CLIC 大赛 )中, “BVE1.2 编码器 ” 拿到两个冠军足以评释实力。
这一套小组合拳下来,嗅觉有好奇的厂商们,揣测满脑子王人是 “ 付款码扫哪儿 ” ?
你还别说,火山引擎也确凿没预备藏着掖着。
像前边说的 BMF 框架,早在客岁就如故开源了,更新完的 BMF lite ,亦然奏凯开源。
总的来说,目下,大模子的进化还在抓续,视频 AI 公司之间的竞争也只会日益强烈。
但如若全球仅仅闭门觅句,相互拿遵守比拼,用居品语言,可能会显得竞争过剩、合作不及。
而行动可能是全中国短视频玩得最熟识的字节逾越,他们旗下的火山引擎一次次地将里面时刻、框架开源。
很是带来的 BMF 框架以及它和智能算力和智能编解码构成的一整套智能底座,确凿能够匡助企业们浅近了多数时刻和资本,更好地匡助 AI 名堂落地发展。
这种竞争和合作共存的格调,才是中国 AI 最乐见识到的阵势。
鹤立鸡群难成林,万紫千红才是春。
包袱剪辑:若风著作内容举报
]article_adlist--> 声明:新浪网独家稿件,未经授权辞谢转载。 -->