新聞資訊
梅奧診所首次發(fā)現(xiàn)可以利用語音診斷心臟病!
日期:2016-11-23 10:01:31 閱讀數(shù):904
語音技術(shù)是這兩年資本市場和巨頭公司追逐的寵兒,從像蘋果的Siri,微軟的Cortana,谷歌的google Assistant這樣的語音助理,以及Amazon Echo和Google Home進(jìn)入客廳和臥室場景的智能音箱,再到今年10月份的錘子新機(jī)發(fā)布會(huì)上,科大訊飛驚艷全場的語音識(shí)別技術(shù)。語音技術(shù)正在融入我們?nèi)粘I畹拿恳粋€(gè)場景,天氣、交通、訂餐、家居……
說話是我們每天都要進(jìn)行的活動(dòng)之一,那么說話和我們健康是否相關(guān)?能否利用語音識(shí)別健康?在此基礎(chǔ)上,隨處可見的語音助理能否成為我們個(gè)人的私人醫(yī)生?
答案是肯定。科學(xué)家認(rèn)為,人們的健康和發(fā)出的聲音息息相關(guān)。如果身體上或心理上出現(xiàn)了問題,那么發(fā)出的聲音可能會(huì)變得纖細(xì),或說話帶有鼻音,或者你的言語更加粗暴,又或者你的聲音會(huì)伴隨著人耳難以區(qū)分的顫抖。
原因就在于,僅說一個(gè)簡單的詞語就需要大腦中的多個(gè)神經(jīng)回路中進(jìn)行復(fù)雜協(xié)調(diào)、對(duì)呼吸系統(tǒng)進(jìn)行*的控制、掌握好協(xié)調(diào)的肌肉骨骼系各個(gè)部分的激活的時(shí)間,這樣才能控制整個(gè)聲道的發(fā)音的清晰度。一旦身體出現(xiàn)了疾病,疾病的特異性干擾會(huì)對(duì)某個(gè)系統(tǒng)或多個(gè)系統(tǒng)會(huì)產(chǎn)生細(xì)微的、難以察覺、但具有特性的變化。而這種變化,是可以利用機(jī)器來進(jìn)行分析計(jì)算的。
奇點(diǎn)糕之前寫過一篇文章,講的就是Sonde Health公司通過分析語音特征來診斷疾病,比如說抑郁癥、腦震蕩、認(rèn)知障礙、帕金森癥等神經(jīng)系統(tǒng)疾病。該公司希望利用人們現(xiàn)有設(shè)備,比如說智能手機(jī),在不記錄人們具體的說話內(nèi)容,僅僅提取人們的語音特征來監(jiān)測人們的生理和心理健康。
現(xiàn)在,語音識(shí)別技術(shù)在健康醫(yī)療領(lǐng)域又有重大突破。這個(gè)月,梅奧診所與以色列語音分析公司Beyond Verbal合作的*:13個(gè)語音特征和冠心病存在相關(guān)性,其中一個(gè)語音特征會(huì)增加冠心病19倍的發(fā)生概率。
這項(xiàng)研究說明在語音特征和冠心病之間存在相關(guān)性。研究人員說,這項(xiàng)研究將在美國心臟協(xié)會(huì)科學(xué)會(huì)議展示。語音特征分析可以輔助醫(yī)生評(píng)估胸痛患者患有冠心病的概率,尤其適合在遠(yuǎn)程醫(yī)療中使用。這項(xiàng)研究*發(fā)現(xiàn)語音特征和純粹的身體疾病存在相關(guān)性,這意味著在未來的某一天,醫(yī)生可以使用語音分析的軟件作為一種無創(chuàng)、輔助診斷工具。
這項(xiàng)研究是一項(xiàng)雙盲研究,一共有150名實(shí)驗(yàn)對(duì)象,包括120名已經(jīng)進(jìn)行了冠狀動(dòng)脈血管造影術(shù)的冠心病患者,9名沒有進(jìn)行冠狀動(dòng)脈血管造影術(shù)的實(shí)驗(yàn)對(duì)象,以及21名健康的實(shí)驗(yàn)對(duì)象作為控制組。
所有的實(shí)驗(yàn)對(duì)象進(jìn)行了冠狀動(dòng)脈血管造影術(shù)之前,使用一個(gè)下載到他們個(gè)人智能手機(jī)的應(yīng)用來錄三段30秒的語音。*段語音要求實(shí)驗(yàn)對(duì)象讀一段*的文本;第二段語音要求實(shí)驗(yàn)對(duì)象描述一段積極的經(jīng)驗(yàn);第三段語音要求研究對(duì)象描述一段負(fù)面的經(jīng)驗(yàn)。
所有錄好的語音將會(huì)由Beyond Verbal提供的工具分析語音的強(qiáng)度和頻率。研究人員利用梅爾頻率倒譜系數(shù)(MFCCs)來從錄好的音頻中提取聲音特征,分析時(shí)不知道實(shí)驗(yàn)對(duì)象的臨床數(shù)據(jù)。
研究人員一開始對(duì)聲音特征使用單因素二元邏輯回歸(Univariate binary logistic regression)進(jìn)行分析,發(fā)現(xiàn)聲音特征與冠心病存在相關(guān)性。為了驗(yàn)證到底哪些聲音特征與冠心病相關(guān),研究人員使用逐步二元邏輯回歸(Stepwise binary logistic regression)分析發(fā)現(xiàn)有13個(gè)聲音特征與冠心病存在相關(guān),其中研究人員在實(shí)驗(yàn)對(duì)象描述消極經(jīng)驗(yàn)的錄音中識(shí)別的「15號(hào)」聲音特征與冠心病存在強(qiáng)相關(guān)性,出現(xiàn)15號(hào)聲音特征的研究對(duì)象所患冠心病的概率是其他人的19倍。結(jié)果顯示,利用聲音特征識(shí)別冠心病獨(dú)立于年齡、性別和其他一些利用傳統(tǒng)冠心病風(fēng)險(xiǎn)評(píng)分的因素。
上圖顯示為在一段消極經(jīng)驗(yàn)時(shí)冠心病患者和控制組語音的功率譜密度對(duì)比(PSD)紅色為冠心病患者,綠色為健康的控制組
至于Beyond Verbal如何從三段錄音中提取聲音特征,可能因?yàn)樯婕吧虡I(yè)機(jī)密,梅奧診所發(fā)布的研究中沒有顯示。很難去描述那些聲音特征聽起來是什么樣的。這些聲音特征不是人類的耳朵可以識(shí)別的。Yuval Mor說,他是Beyond Verbal的CEO。這和我們的視力很相似,人眼可以看到一個(gè)特定的光譜,但實(shí)際上現(xiàn)實(shí)中還存在更多的光譜。
Beyond Verbal,成立于2012年。2014年推出了Beyond Wellness API 。這款軟件可以將智能手機(jī)或配置麥克風(fēng)的可穿戴設(shè)備變?yōu)椤盖榫w傳感器」,不考慮實(shí)際內(nèi)容和上下文語義,而是研究語音中的語調(diào)、頻率來監(jiān)測用戶的情緒。該公司有兩個(gè)免費(fèi)、面向消費(fèi)者的應(yīng)用程序,Moodie 和Empath,并且還有一個(gè)面向臨床醫(yī)生的應(yīng)用Beyond Clinic,他們希望在任何場景下都可以監(jiān)測識(shí)別情緒的手段,比如說工作場景,市場研究場景,甚至梅根凱利采訪川普的視頻都可以進(jìn)行情緒的識(shí)別。
9月份,Beyond Verbal推出一個(gè)研究平臺(tái),將它的軟件用于健康醫(yī)療領(lǐng)域,想要通過識(shí)別語音的生理標(biāo)志來進(jìn)行健康問題的診斷。這家公司雖然擁有語音分析的經(jīng)驗(yàn),但一直以來更側(cè)重于檢測那些明顯會(huì)影響到個(gè)人聲音的疾病,比如說帕金森和其他的影響神經(jīng)認(rèn)知功能的疾病。這項(xiàng)和梅奧診所的研究是*揭示了語音特征可以用來識(shí)別單純的身體疾病。
這項(xiàng)研究已經(jīng)進(jìn)行了兩年,我們花了很長時(shí)間證明兩者之間存在聯(lián)系, Mor說,發(fā)現(xiàn)聲音特征和身體疾病之間的相關(guān)性意味著在其他領(lǐng)域可以應(yīng)用這項(xiàng)技術(shù)。比如說內(nèi)嵌到一個(gè)APP中,通過說一段話來為人們的心臟健康進(jìn)行預(yù)警。本次研究為我們開了一扇門,讓我們可以繼續(xù)心臟健康方面更多邊、多語言的研究。Mor說。
Beyond Verbal 將會(huì)和梅奧診所繼續(xù)合作,將會(huì)在不同的語言環(huán)境中檢測這項(xiàng)技術(shù),確認(rèn)語音特征分析是否會(huì)超越語言。