• Well-Being技術

音声感情認識

相手の感情を声だけで推測します。

音声感情認識

概要

  • 顔を見れば相手の感情は推測できるが、声だけでは難しい。
  • 機械にも私の感情を分かってほしい。
  • クレームの電話をしているのに、明るい声で対応されるとイラっとすることもある。

特徴

  • 音韻単位の認識であるため、言語の種類・個人差・地方差に影響されず、不特定多数を対象とした音声認識に適する。
  • 短い会話や単純な会話でも、感情の強度を判定可能、特に「怒り」の感情認識に強い。
  • 話者の感情あるいは発話態度によって、音声中のところどころに音韻単位で観察される「裏声」「力んだ声」「気息性の声」などの特定の音響特性から、特徴的音色を検出して感情を認識するシステム。

「怒り」を認識した場合の応用例

自動応答システムで丁寧に応対
アバター・キャラクター画像で画像の変更
対話ロボット・AIスピーカーで誤認識(?)→実行コマンドの修正
通常波形/「力み」がみられる波形

※音韻
「h」(声門によって構音される無声摩擦子音)
「k」(軟口蓋によって構音される無声破裂子音)
「d」(硬口蓋によって構音される有声破裂子音)「m」(口唇によって構音される鼻音)
「g」(軟口蓋によって構音される有性破裂子音)

活用

  • コールセンター、自動電話応対システム、電子秘書システム、アバターやキャラクター画像との対話、対話ロボット等、音声対話によるインターフェースを持つ対話システム。
活用イメージ