SAカレッジ22年度 コースⅡ第11回月例会は、伊藤 彰則 教授です!

音声認識・対話システム研究のエキスパート

SAカレッジ22年度 コースⅡ第11回月例会は、 総長特別補佐(情報基盤担当)、情報シナジー機構 副機構長、伊藤 彰則 教授 「ロボットからエンターテイメントまで~幅広い分野に応用が広がる音声対話技術~」です。

音声対話システムとは、人間と機械が音声を使ってやり取りするシステムです。かつてはSFの中にしか存在しない技術でしたが、近年の音声認識・音声合成・言語処理技術の発展により、ある程度一般に使える技術になってきています。

この講義では、音声対話システムの歴史と基礎技術、いくつかの応用、および今後の展望について、4つの構成でお話しいただきます。

  • 音声対話システムとは
  • 音声認識、音声合成の最新技術
  • 音声対話システムの種類と技術
  • 音声対話システムの応用

「音声認識や音声対話というものは、ロボットも含めて、これからの技術と言われながら数年前まで実用化されなくて、「本当にできるの?」と言われてたんですけれども、計算機の性能も上がってきてますし、技術も性能が上がってきて、実際に家庭で使われるパーソナルロボットであるとか、スマホ上で何かアシスタントっていうようなものが、今後、より使われるようになるんじゃないかなぁと思います。」と仰ってました。

ご研究について

音声認識、音声合成、音声対話、音声処理、音楽情報処理、音声言語処理、マルチモーダル・マルチメディア情報処理、その他よくわからない研究など、 音・声・言葉を中心とした次世代HCI(Human Computer Interaction)のための研究をしています。(以上、東北大学大学院 工学研究科 通信工学専攻 伊藤・能勢研究室HPより抜粋

Best Paper Award of International Conference on Natural Language Processing and Knowledge Engineering(2008) 、Best Paper Award of International Conference on Intelligent Information Hiding and Multimedia Signal Processing(2007)などを受賞されている伊藤先生の、最近の主な研究内容について一部ご紹介します。

  • AIにより日本人英語音声の高精度な自動発音評価が可能に ~スマホ等を活用した低コストな英会話練習が可能に~
    東北大学大学院工学研究科の伊藤彰則教授、能勢隆准教授、千葉祐弥助教および付江大学院生は、日本人が発声した英語文の発音の上手さ(英語母語話者らしさ)を高い精度で自動的に推定する技術を開発しました。深層学習※1を用いた音声認識システムを使い、英語母語話者としての英語音声認識の結果と、日本語母語話者としての英語音声認識の両方の認識結果を比較することで、実際の英語ネイティブ教師による発音の評価と非常に近い発音評価が可能になりました。本研究成果は、2019年12月23日にSpeech Communication誌に掲載されました。
  • 日本語文難易度推定と音声合成による「やさしい日本語」作成補助システムの研究開発
    「やさしい日本語」の文作成および音声アナウンス作成を高度化するため、やさしい日本語支援システム「やんしす」の高度化、およびそれに必要な調査研究を行った。調査内容としては、文難易度の自動推定、文の難易度、話速、ポーズおよび音響環境による音声劣化が文の聴き取りにどのように影響するかを調べた。これによって「やさしい日本語」音声として適切な話速が明らかになった。これを受けて、文難易度推定および音声合成機能を「やんしす」に実装した。
  • エージェントとの対話に基づく英語学習システムの開発
    本研究では、日本人英語学習者がエージェント(CGキャラクタおよびロボット)と対話を行うことにより、英会話のコミュニケーション能力を高めるためのシステム開発を行った。まず、英語による音声対話・指差しによる場所の共有・人追従による室内移動などの能力を持った移動ロボットを開発した。また、誤りを含んだ日本人英語学習者の音声を、誤りも含めて正確に認識するためのアルゴリズムを開発した。さらに、CGキャラクタとの英会話練習において、適切な応答タイミングを習得するための手法を開発した。

紹介ページ

SAカレッジでの伊藤先生の講義に関する情報はこちら
SAカレッジに関する詳しい資料入手はこちら
SACプロジェクト共同研究等に関するお問い合わせはこちら

あわせて読みたい関連記事

サブコンテンツ

このページの先頭へ