AI生成圖像、影片後,OpenAI開發「聲音引擎」再創新猷 聲音也能生成複製!

AI生成圖像、影片後,OpenAI開發「聲音引擎」再創新猷 聲音也能生成複製!
KRJ 2024/03/31

人工智慧(AI)技術發展一日千里,繼生成圖像、影片功能後,美國AI開發公司OpenAI又推出「聲音引擎」(Voice Engine)系統,只要上傳15秒鐘自己的語音檔,就能用合成聲音替對方讀出任何一段文字,而且不限原來的語言,甚至可以轉化為中文。

也就是說,你用英語對「聲音引擎」唸一段文字,它可以用西班牙語、法語、華語或任何語言,以你的聲音「發言」。

這項技術可應用於有聲書、網路聊天機器人、廣播電台節目主持人等領域,但也可能被用來散播假訊息、進行詐騙或其他犯罪行為;OpenAI表示,認知到這些問題,因此將對更廣泛的發布採取謹慎態度。該公司產品開發經理哈里斯(Jeff Harris)說,「基於合成語音濫用的可能性,我們將隨時掌握狀況。」

OpenAI正在研究以「數位浮水印」等方法,防範不法分子以「聲音引擎」為工具,偽造政治人物或名人的聲音做壞事;哈里斯說,暫不公開發行「聲音引擎」,因為它很危險,尤其在選舉年。公司也不想馬上靠這套AI技術賺錢;不過他說,這套系統對於因為生病或意外事故而喪失聲音的人「特別有用」。


AI助失聲患者重建說話功能
哈里斯指出,OpenAI幫助一名因腦癌損壞聲帶,不能說話的女性患者,利用她高中時留下的一小段錄音,重建說話功能。這項技術為失聲患者帶來新的希望,也讓人們更加期待AI技術的未來發展。

KRJ 資深編輯