大河報(bào)·豫視頻記者 孫凱杰
【核心提示】
最近,很多人都被社交網(wǎng)絡(luò)上的一類視頻刷屏了:郭德綱用英語說相聲、趙本山用英語講小品、泰勒·斯威夫特用中文接受采訪……這類由AI生成的視頻,竟然能僅憑原視頻,就能翻譯毫無違和感的多種語言視頻,這一功能被眾多網(wǎng)友評(píng)價(jià)為“顛覆性的功能”。
讓郭德綱說英語相聲毫無違和,這家軟件出自華人老板
這些顛覆性的效果,都出自一家名為HeyGen的軟件之手。HeyGen成立于2020年,是一家以人工智能、計(jì)算機(jī)視覺主導(dǎo)的公司,而他的創(chuàng)始人Joshua Xu是一名華人,其個(gè)人資料顯示,Joshua Xu于2013年畢業(yè)于同濟(jì)大學(xué),隨后赴美,2014年畢業(yè)于卡內(nèi)基梅隆大學(xué),畢業(yè)后在照片分享應(yīng)用SnapChat公司擔(dān)任了6年的工程師職位,之后便創(chuàng)立了HeyGen公司。
HeyGen創(chuàng)始人Joshua Xu的個(gè)人資料頁面
HeyGen公司擁有眾多業(yè)務(wù)。記者在HeyGen的官網(wǎng)上看到,他們提供了一系列數(shù)字孿生相關(guān)的業(yè)務(wù),例如數(shù)字人模型、虛擬主播播報(bào)、生成本人的數(shù)字孿生模型等多項(xiàng)功能。不過,自從2023年8月推出了“視頻翻譯”功能后,HeyGen便打開了新世界的魔法,不僅讓馬斯克都直呼“有意思”,更是在中文互聯(lián)網(wǎng)中,徹底地火了一把。
馬斯克對(duì)HeyGen翻譯視頻功能的評(píng)價(jià)
從10月起,中文互聯(lián)網(wǎng)陸續(xù)出現(xiàn)了大批“翻譯視頻”,令不少老梗翻紅,更讓許多名場面加了點(diǎn)新味道。這其中,最出圈的莫過于“郭德綱用英語說相聲”。在嗶哩嗶哩網(wǎng)站中,相關(guān)視頻里播放最高的一條已經(jīng)超過了80萬的點(diǎn)擊量。面對(duì)如此“絲滑”的口音轉(zhuǎn)換,不少人評(píng)論道:“是不是以后一半翻譯專業(yè)的人都要失業(yè)了?”
除了顛覆性的技術(shù)意外,這份惶恐,似乎也是“視頻翻譯”功能爆火的一大原因。不過,根據(jù)記者實(shí)際測試,HeyGen目前的口型、口音甚至動(dòng)作都能做到惟妙惟肖,但仍會(huì)有翻譯不夠準(zhǔn)確的現(xiàn)象存在。
記者實(shí)測“視頻翻譯功能”:排隊(duì)需要一整天,英譯中并不算完美
目前,HeyGen為免費(fèi)用戶提供了大約2次的免費(fèi)翻譯功能,用戶可以自行上傳一段2-5分鐘的視頻,選擇輸出語言,就能進(jìn)行轉(zhuǎn)換了。不過,由于HeyGen目前太過火爆,免費(fèi)用戶需要排隊(duì)等待,而付費(fèi)用戶則可以優(yōu)先進(jìn)行后臺(tái)轉(zhuǎn)換,導(dǎo)致等待時(shí)間較長。在網(wǎng)站中,我們處于第6000多名的位置,記者等待了近24個(gè)小時(shí),才成功下載到了轉(zhuǎn)換好的視頻。
為了對(duì)比HeyGen翻譯視頻的準(zhǔn)確度,記者找到了蘋果公司創(chuàng)始人喬布斯的一段英文演講視頻,附帶雙語字幕,其中的中文字幕是由人工翻譯的,更貼近中文語法語境,方便后期與HeyGen的成果作對(duì)比。
在轉(zhuǎn)換的視頻中,HeyGen在口音、聲音、動(dòng)作上,都做到了相當(dāng)成熟的水準(zhǔn),視頻中的一字一頓,都像是真實(shí)發(fā)生的一樣。不過,在翻譯的適配上,HeyGen更傾向于識(shí)別英文語音直譯,與中文的敘述語序有些割裂;并且,在中斷的連句中,HeyGen有時(shí)會(huì)判斷錯(cuò)誤,把上一句的后半句識(shí)別成下一句的上半句,導(dǎo)致曲解原意。
由此看來,HeyGen無論是在時(shí)間成本還是在準(zhǔn)確度上,都無法代替一部分的人工翻譯功能。不過,它將多項(xiàng)開源應(yīng)用整合,推出了如此完善的產(chǎn)品,不得不令人對(duì)人工智能的未來產(chǎn)品充滿了期待。
記者使用HeyGen翻譯的視頻截圖
資料顯示,HeyGen的翻譯功能、口型同步、語音克隆均使用了不同公司開發(fā)的技術(shù),這也算是“虛擬世界的供應(yīng)鏈整合”了。目前,HeyGen的最低訂閱價(jià)格是29美元/月。
視頻翻譯“圖一樂”,但傳播也有法律風(fēng)險(xiǎn)
隨手刷刷幾個(gè)熱門視頻平臺(tái),很容易就能找到類似的翻譯視頻。相比于發(fā)布轉(zhuǎn)載其它視頻,這些翻譯視頻會(huì)讓自媒體博主獲得更高的流量、更高的關(guān)注度,進(jìn)而從中獲利。如果制作翻譯視頻只是為了“圖一樂”倒還好,當(dāng)下已有不少博主翻譯他人的視頻傳播獲利,又會(huì)有哪些法律風(fēng)險(xiǎn)呢?
上海大邦律師事務(wù)所高級(jí)合伙人游云庭律師向記者介紹,在互聯(lián)網(wǎng)傳播他人的翻譯視頻,可能存在三個(gè)方面的風(fēng)險(xiǎn):
首先是人身權(quán)的風(fēng)險(xiǎn)。個(gè)人肖像、聲音權(quán)都是受到保護(hù)的,如果把他人的肖像上傳,再對(duì)其聲音做處理,之后獲得盈利,那毫無疑問是侵權(quán)行為。
其次是知識(shí)產(chǎn)權(quán)的風(fēng)險(xiǎn)。每個(gè)原視頻,攝制者的權(quán)利都會(huì)被保護(hù),而如果使用原視頻剪輯、編輯后形成新的視聽作品,也需要先獲得攝制者的授權(quán)。
最后是文字授權(quán)的風(fēng)險(xiǎn)。每個(gè)含有講話的片段都包含著各種語言的文字,二創(chuàng)者不僅要為這些文字拿到授權(quán),還要拿到翻譯的授權(quán)。
游云庭向記者介紹,比如你傳了郭德綱的相聲視頻,就需要取得郭德綱的肖像權(quán)、聲音權(quán)的授權(quán)、相聲視頻的錄像制作者權(quán)和相聲文字內(nèi)容版權(quán)授權(quán),缺少任何一個(gè)都可能涉嫌侵權(quán),“當(dāng)然,郭德綱是公眾人物,這種無傷大雅的傳播其可能未必會(huì)維權(quán),但如果其想維權(quán),發(fā)布視頻者打官司肯定會(huì)輸。”游云庭說道。
記者經(jīng)過檢索發(fā)現(xiàn),目前,一些視頻網(wǎng)站會(huì)對(duì)AI合成的視頻加上“該內(nèi)容疑似使用AI技術(shù)合成,請(qǐng)謹(jǐn)慎甄別”的類似標(biāo)簽,但大部分平臺(tái)尚未對(duì)此類視頻進(jìn)行下架處理。HeyGen固然是個(gè)好工具,但如果用錯(cuò)了地方,還有可能為此付出沉重的代價(jià)。
來源:大河報(bào)·豫視頻