語音是人類交流的重要方式,但說話者的健康狀態(tài)(例如神經(jīng)疾病、癌癥、外傷等原因?qū)е碌穆曇粽系K)和周圍環(huán)境(噪音干擾、傳播介質(zhì))往往會影響聲音的傳輸和識別。研究人員一直在改進通用語音識別和交互技術(shù),這些技術(shù)可以很好地處理細微的聲音或嘈雜的環(huán)境。多通道聲波傳感器可以提高聲音識別的精度,但因體積較大而無法佩戴。近期,清華大學的研究團隊開發(fā)了一種基于石墨烯的智能可穿戴人工喉(AT),可以實現(xiàn)語音感知和發(fā)聲。研究成果發(fā)表在《Nature Machine Intelligence》期刊,論文的標題“Mixed-modality speech recognition and interaction using a wearable artificial throat”。
該研究團隊通過激光直寫技術(shù)在超薄聚酰亞胺薄膜上轉(zhuǎn)化出基于石墨烯的智能可穿戴人工喉(AT),實現(xiàn)了對聲音信號和機械運動的混合模態(tài)的感知,使AT能夠獲得低基頻信號,同時具有抗噪聲的語音感知能力。實驗結(jié)果表明,混合模態(tài)AT能夠檢測基本語音元素(音素、聲調(diào)和單詞),平均準確率達到99.05%。此外,通過集成AI模型,AT識別出了喉切除術(shù)患者含糊說出的日常詞匯,準確率超過90%。同時,AT還可以通過熱聲效應實現(xiàn)聲音的播放功能,以恢復患者的發(fā)聲能力。
該研究提出的AT具有制作工藝簡單、性能穩(wěn)定、抗噪性強、可集成發(fā)聲等特點,使其成為下一代語音識別和交互系統(tǒng)的有力工具。