火山引擎是字節跳動旗下的云服務平臺, 將字節跳動快速發展過程中積累的增長方法、技術能力和工具開放給外部企業,提供云基礎、視頻與內容分發、大數據、 人工智能、開發與運維等服務,幫助企業在數字化升級中實現持續增長。
火(huo)(huo)山(shan)引擎的技術(shu)(shu)(shu),脫胎于(yu)抖(dou)音的技術(shu)(shu)(shu)實踐,所以AI技術(shu)(shu)(shu)和算法能力(li)都(dou)頗(po)具功底。技術(shu)(shu)(shu)開年(nian),AI技術(shu)(shu)(shu)也是其(qi)中非常重(zhong)要的一環。今年(nian)春節,人民日報新媒體(ti)推出的冰(bing)(bing)雪實景(jing)的“我是冰(bing)(bing)雪高(gao)手”活動(dong),就是由火(huo)(huo)山(shan)引擎視覺AI技術(shu)(shu)(shu)支撐的。
在“我是冰雪高(gao)手”AI互(hu)動小程序(xu)推出(chu)后,觀看量已超過(guo)5000萬次,熱(re)度(du)沖(chong)至抖音熱(re)榜(bang)第三名(ming),楊倩、何(he)沖(chong)、郎朗等眾多名(ming)人帶(dai)領近百(bai)萬民眾參與。相比圖片“換臉”,視(shi)頻“換臉”需要(yao)考慮如何(he)在移(yi)動狀態下實(shi)現逼真效(xiao)果,技術難度(du)更高(gao)。
火山(shan)引擎提供的(de)(de)視(shi)覺(jue)AI技術源自字(zi)節跳(tiao)動智創團隊,經過長期研(yan)發攻堅構建了(le)(le)一套完善的(de)(de)視(shi)頻人(ren)臉融(rong)合(he)(he)的(de)(de)解決方案- SwapGAN。該方案基于GAN的(de)(de)深度學習模型進行(xing)了(le)(le)創新性研(yan)發,在確保數據(ju)安全合(he)(he)規的(de)(de)前提下,可將用戶上傳的(de)(de)人(ren)臉照片(pian)無(wu)縫(feng)融(rong)合(he)(he)到目(mu)標視(shi)頻素材中,融(rong)合(he)(he)效果(guo)逼真自然,無(wu)論是從(cong)效果(guo)上,還是性能上,都達到了(le)(le)業界領先(xian)水平(ping)。