語音識別技術(shù)是未來
從你的話語中真能聽出你是怎樣的一個人嗎?其實答案甚至超出了人類大腦的想象。從你的聲音中可以察覺到你的情緒、社會地位、成長經(jīng)歷、年齡、種族、體重、身高,以及面部特征—此外還有你周圍的環(huán)境信息。
人耳無法察覺這些細(xì)微的信息。但是人工智能呢?那就是另外一回事情了。
經(jīng)常通過“以培訓(xùn)為目的”的客戶服務(wù)電話錄音來學(xué)習(xí)的軟件,目前可以從聲音中提取微觀特征,這些特征反映出了講述者的具體情況。這個概念被稱作“語音畫像”,2017年12月,卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)的研究人員實現(xiàn)了一個突破,他們利用人工智能,僅憑分析錄音,便創(chuàng)造出講述者面部的三維影像。“你的聲音就像是你的DNA或指紋。”卡內(nèi)基梅隆大學(xué)負(fù)責(zé)這項研究工作的麗塔·辛格(Rita Singh)說。
人類對語音分析的研究已經(jīng)持續(xù)了數(shù)十年,但是直到這一次,語音識別才開始進(jìn)入主流。如今,由于計算能力的大幅提高,以及算法的日益復(fù)雜,一大批語音技術(shù)蓬勃發(fā)展。
美國海岸警衛(wèi)隊(U.S. Coast Guard)正在利用卡內(nèi)基梅隆大學(xué)的人工智能技術(shù)對撥打惡作劇報警電話的人立案,這些惡作劇電話會讓實施營救的隊員撲空,從而造成時間和金錢的浪費(fèi)。海岸警衛(wèi)隊每年大約接到150個惡作劇電話。這項技術(shù)已經(jīng)在一起針對撥打此類電話的刑事案件中發(fā)揮了作用,不過目前還不清楚這樣的聲音指紋能否成為呈堂證供。
聲音指紋有可能幫你減少銀行的安全漏洞,因為它知道你是你,而不是一母同胞的邪惡姊妹。它還能讓你的車認(rèn)識你,當(dāng)你坐進(jìn)駕駛座并且開口說話后,汽車會解除防盜報警,自動調(diào)節(jié)座椅,并且根據(jù)你的喜好調(diào)節(jié)溫度。[寶馬(BMW)、奧迪(Audi)和福特(Ford)等汽車生產(chǎn)商正在與馬薩諸塞州伯靈頓(Burlington)的Nuance Communications公司合作開發(fā)這項技術(shù)。]
如果你向電視機(jī)詢問有什么好看的喜劇,聲音指紋也許會讓電視機(jī)打開一部R級的電影,而不是9歲的女兒提出同樣問題時打開的G級電影。法國的Orange TV正在與Nuance公司合作開發(fā)這樣的應(yīng)用程序軟件。
“這僅僅是開始。”Future Today Institute公司的創(chuàng)始人艾米·韋布(Amy Webb)說。“未來10年,我們即將(在生物識別和語音技術(shù)方面)經(jīng)歷翻天覆地的變化。”Future Today Institute是一家技術(shù)公司,它預(yù)測未來的技術(shù)趨勢。
辛格希望有一天她的技術(shù)可以在醫(yī)生進(jìn)行遠(yuǎn)程醫(yī)療時發(fā)揮作用,為帕金森病(Parkinson's disease)等疾病的早期患者確診。對于這項技術(shù)的潛能而言,這個應(yīng)用程序可能只是冰山一角。辛格說:“如果DNA可以定義你本人,那么從你的聲音中就可以捕獲你的完整人格。”(財富中文網(wǎng))
譯者:錢志清
-
熱讀文章
-
熱門視頻