◎文 《法人》雜志全媒體記者 白馗 見習記者 姚瑤
隨著AI語音合成技術的廣泛應用,聲音被收集、合成、制作、模仿甚至篡改的現象越來越普遍,這對聲音權益的保護提出了前所未有的挑戰(zhàn)。

▲CFP
2024年4月,北京互聯(lián)網法院一審開庭宣判了全國首例AI生成聲音人格權侵權案,明確認定在具備可識別性的前提下,自然人聲音權益的保護范圍可及于AI生成聲音。同時,AI生成聲音可識別性的認定應綜合考慮行為人使用情況,并以相關領域普通聽眾能否識別作為判斷標準。
AI“偷走”配音師原聲
某天,配音師殷某發(fā)現自己的聲音被AI處理并在多個知名APP廣泛流傳,而這些被AI生成的作品經聲音篩選和溯源,發(fā)現來自北京某智能科技公司(下稱“被告一”)。在被告一運營的平臺中,用戶只要輸入文本、調整參數,即可實現文本轉化成語音功能。殷某曾接受北京某文化傳媒公司(下稱“被告二”)委托錄制錄音制品,且被告二為錄音制品的著作權人。
判決書顯示,調查發(fā)現,被告二在殷某為其錄制錄音制品后,將音頻提供給某軟件公司(下稱“被告三”),允許被告三以商業(yè)或非商業(yè)的用途使用、復制、修改數據用于其產品及服務。被告三僅以原告錄制的錄音制品作為素材進行AI化處理,生成了涉案文本轉語音產品并在上海某網絡科技公司(下稱“被告四”)運營的云服務平臺對外出售。被告一與北京某科技發(fā)展公司(下稱“被告五”)簽訂了在線服務買賣合同,由被告五向被告三下單采購,其中包括涉案文本轉語音產品。被告一采取應用程序接口形式,在未經技術處理的情況下,直接調取并生成文本轉語音產品在其平臺使用。原告殷某主張,被告行為已經嚴重侵犯其聲音權益,被告一、被告三應立即停止侵權、賠禮道歉,五被告應當賠償原告經濟損失、精神損失。
法院審理認為,自然人聲音以聲紋、音色、頻率為區(qū)分,具有獨特性、唯一性、穩(wěn)定性特點,能夠給他人形成或引起一般人產生與該自然人有關的思想或感情活動,可以對外展示個人行為和身份。自然人聲音的可識別性是指在他人反復多次或長期聆聽的基礎上,通過該聲音特征能識別出特定自然人。利用人工智能合成的聲音,如果能使一般社會公眾或者相關領域的公眾根據其音色、語調和發(fā)音風格,關聯(lián)到該自然人,即可以認定為具有可識別性。
本案中,因被告三系僅使用原告?zhèn)€人聲音開發(fā)涉案文本轉語音產品,而且經當庭勘驗,該AI聲音與原告的音色、語調、發(fā)音風格等具有高度一致性,能夠引起一般人產生與原告有關的思想或感情活動,能夠將該聲音聯(lián)系到原告本人,進而識別出原告的主體身份。因此,原告聲音權益及于涉案AI聲音。最終,被告一北京某智能科技公司、被告三某軟件公司向原告賠禮道歉,被告二北京某文化傳媒公司、被告三某軟件公司向原告賠償損失共計25萬元。
近日,北京天達共和(武漢)律師事務所合伙人崔逢銘在接受《法人》記者采訪時表示,本案系全國首例“AI聲音侵權案”。根據《中華人民共和國民法典》(下稱“民法典”)第一千零二十三條第二款,對自然人聲音的保護,參照適用肖像權保護的有關規(guī)定,即自然人的聲音權也是受法律保護的一項人格權。根據民法典第一千零一十八條第二款,肖像是通過影像、雕塑、繪畫等方式在一定載體上所反映的特定自然人可以被識別的外部形象,即肖像需要具有可識別性。由于聲音權的保護參照肖像權的規(guī)定,那么聲音作為人身專屬的權益,應當具有可識別性,即社會公眾可以根據該聲音識別出特定主體的身份。
“可識別性”是法律邊界
近日,上海華聯(lián)律師事務所律師藍花棉向記者分析,本案中,雖然AI生成的聲音與自然人聲音并不高度一致,但法院的判決關鍵在于聲音的“可識別性”。也就是說,AI生成的聲音具有可識別性,即使與自然人聲音不完全一致,也能關聯(lián)到特定的自然人,從而構成侵權。
“可識別性的判斷標準包括AI聲音是否能使一般社會公眾或相關領域的公眾根據其音色、語調和發(fā)音風格關聯(lián)到該自然人,引起一般人產生與該自然人有關的思想或感情活動,能夠將該聲音聯(lián)系到特定自然人?!彼{花棉說。
崔逢銘也認為,聲音的可識別性是聲音能夠成為一項人格權的前提條件。
近日,北京鼎世律師事務所律師龐理鵬在接受記者采訪時表示,主流觀點認為,聲音權益是一種人格利益,包括聲音的可識別性和聲音的內容。倘若一段聲音無法識別出特定主體的身份,那么其將難以受到法律保護。因此,身份可識別性也可以作為自然人聲音權益的法律邊界。
“然而,由于聲音是一種人格權益,人工智能并不具備所謂的‘人格’。因此,在當前法律框架下,人工智能是否有聲音權益還處于爭議階段?!饼嬂睐i表示,需要明晰的是,如果人工智能合成后的聲音與自然人的聲音并不一致,即無法通過合成后的聲音識別到自然人,并不構成侵權。
崔逢銘表示,判斷AI合成的聲音與自然人聲音是否一致,主要有兩種方式:一是普通聽眾測試,即以一般社會公眾或普通聽眾能否識別為標準,判斷AI合成聲音是否具有可識別性;二是技術鑒定,即通過專業(yè)的聲紋識別技術,分析音色、語調、頻率、發(fā)音風格等特征。
“當然,從訴訟維權的角度來看,可以先從普通聽眾的視角來進行聲音辨識測試,進而判斷AI合成的聲音與自然人聲音的一致性程度,如果不能準確判斷,也可視情委托第三方機構進行鑒定?!贝薹赉懛治觥?/p>
著作權不等于聲音權
值得一提的是,本案被告二辯稱,其將有音頻著作權及鄰接權的錄音制品用于與被告三某軟件公司合作符合相關法律規(guī)定,各個環(huán)節(jié)都已簽署協(xié)議和支付費用,不存在主觀故意的侵權行為。AI音頻產品適用的配音內容和場景不同于單純的有聲讀物,而是一個綜合的音頻內容,根據音頻內容熱度等因素造成的傳播量非配音人一己之力可以達成。
法院審理認為,被告二關于獲得原告合法授權的抗辯不能成立。被告二對錄音制品享有著作權等權利,但不包括授權他人對原告聲音進行AI化使用的權利。被告二與被告三簽訂數據協(xié)議,在未經原告本人知情同意的情況下,授權被告三AI化使用原告聲音的行為無合法權利來源。
“簡單來講,原告的聲音權益與被告二北京某文化傳媒公司對錄音制品享有的權利是兩種完全不同的權利。原告的聲音權益按照民法典的規(guī)定是一種人格權。而被告二的權益是一種著作權鄰接權?!饼嬂睐i告訴記者。
所謂鄰接權,是指作品的傳播者和作品之外勞動成果的創(chuàng)作者對其勞動成果享有的專有權利的總稱。龐理鵬表示,鄰接權產生的主要原因是由于一些非物質勞動成果雖然有其自身存在的價值,但由于其本身獨創(chuàng)性較低,不屬于《中華人民共和國著作權法》(下稱“著作權法”)保護的作品。但又需要對該部分“作品”所付出的勞動的成果進行有效保護。因此,在著作權法中新設一種與傳統(tǒng)著作權之外的新型權利類型,專門用于保護那些“獨創(chuàng)性”程度不高但又與作品有一定聯(lián)系的勞動成果,即鄰接權。
龐理鵬認為,被告二的錄音制品就屬于鄰接權。其專有名稱是錄音錄像制作者權,是指錄音、錄像制品的制作者對其制作的錄音、錄像制品享有的專有權利。按著作權法第四十條及第四十五條,其權利內容不包括自然人的聲音權。
隨意上傳AI作品面臨侵權
“這起全國首例AI生成聲音人格權侵權案體現了司法對新技術應用的規(guī)范和引導,兼顧保護人格權益與技術發(fā)展,具有里程碑意義。”崔逢銘表示,我國民法典將人格權獨立成編,以立法形式將保護“聲音”寫入人格權編,明確參照適用肖像權的有關規(guī)定保護自然人的聲音。本案反映了人格權與AI技術之間的沖突,明確了自然人聲音權益的保護范圍涵蓋AI合成聲音,并通過專業(yè)技術手段鑒定AI合成聲音與自然人聲音的相似度。同時,在法律適用上,明確了AI合成聲音的法律邊界和可識別性標準,為后續(xù)類似案件提供了裁判標準。因此,為了避免人格權益與AI技術的沖突,建議相關使用主體在使用AI技術處理他人聲音前,注意取得相應授權,做到依法行事、合法使用。
對此,藍花棉提示,在簽訂涉及聲音使用的合同時,雙方當事人應注意聲音權益的歸屬和授權以及使用范圍、期限和費用、侵權救濟措施、特殊情況的處理、法律適用和爭議解決等多方面。
“提供換臉、變聲等軟件的企業(yè),勢必涉及營利問題,故這類企業(yè)需要確保人物面部特征、聲音特征不會與某自然人高度相似,必要時需要向自然人索要授權?!饼嬂睐i提示,如果上傳AI生成視頻的自然人只是“自娛自樂”,而非以營利為目的,基本上可以滿足著作權法中合理使用的要求。但如果這類自然人用戶以營利為目的,則可能面臨侵權和賠償問題。同時,自然人在發(fā)現自己的肖像、聲音、姓名等信息,未經允許被商用后,可以先和商用企業(yè)溝通,要求對方刪除、下架、賠償等。也可以向第三方平臺說明情況,要求平臺下架該企業(yè)的侵權內容。如果上述途徑均無法維權,自然人可以向法院提起訴訟。
編審|王 婧
責編|王 茜
校對|張波 張雪慧

關于我們
聯(lián)系我們
微信公眾號
返回頭部