硬貨と同じサイズのグラフェンシートを喉の近くの首に貼ると、構音障害者が再び発音できるようになる。清華大学集積回路学院の任天令教授およびその協力チームはこのほど、スマート音声インタラクションの面で重要な成果を上げた。同チームが研究開発したウェアラブル人工喉は喉の発音と関連する信号を感知するとともに、人工知能(AI)モデルによってこれを識別し音声に合成する。その復元の正確度は90%を超えている。光明日報が伝えた。
音声認識・インタラクションシステムに新たな技術的ルートを提供している同研究結果は、このほど「ネイチャー」のAI姉妹誌「Nature Machine Intelligence」にオンライン掲載された。
商用マイクや圧電フィルムと比べると、人工喉は低周波の筋肉運動、中周波の食道振動、高周波の音波情報に高い感度を持つと同時に、騒音に強い音声感知能力も備える。音響信号と機械運動の混合モードへの感知により、人工喉はより低い音声基本周波信号を獲得できる。このほか、同デバイスは熱音響効果により音声を再生する機能も実現できる。人工喉は製造プロセスがシンプルで、性能が安定し、集約しやすく、音声認識・インタラクションに新たなハードウェアプラットフォームを提供している。任氏の研究チームはその音声インタラクションの応用例をさらに示した。具体的には、AIモデルの集約を通じ、人工喉は喉頭摘出術患者が口にする日常的な言葉を識別でき、正確度は90%を超えた。識別された内容は音声に合成され人工喉によって再生された。これは患者の音声コミュニケーション力を大まかに回復できる。(編集YF)
「人民網日本語版」2023年3月20日