系列変換モデルによるプレゼンテーション動作の生成

概要

 人間は他者に情報を伝えるために様々な表現を行います。 その手法は多岐にわたり、人間に備わった高い表現力を裏付けるものばかりです。 我々はこの表現力をAIに実装することで、AIと人間のコミュニケーションをより活発なものに出来るのではないかと考えました。 そこで本研究では、プレゼンテーションにおける動きによる表現に着目し、AIへの実装を目標にしました。
 本研究では人間の発話時の動きの要素は非言語的内容、言語的内容、文脈の3つの要素に分けられると考えました。そこでこれら3つの要素をそれぞれ実装し、組み合わせることで動きによる表現を実現しようと考えました。 文脈はプレゼンテーションに固定し、非言語的内容による動作は機械学習を用いて、言語的内容はジェスチャの合成によってそれぞれ実装を行いました。 提案手法によって生成された動作を用いて印象評価実験を行った結果、生成された動作は人間のものと匹敵する自然さと生々しさを持つことがわかりました。また、ジェスチャの合成によって技術、ジェスチャの活用度、熱意の評価が向上することもわかりました。

研究スライド


▼ 嶋津章仁(Akihito Shimazu)
  1. 嶋津章仁, 日永田智絵, 長井隆行, 中村友昭, 武田祐樹, 原豪紀, 中川修, 前田強, "系列変換モデルを用いたプレゼンテーション動作の生成", 人工知能学会全国大会, 2G1-03, 2018.6.6, 鹿児島
  2. Akihito Shimazu, Chie Hieida, Takayuki Nagai, Tomoaki Nakamura,Yuki Takeda, Takenori Hara, Osamu Nakagawa, Tsuyoshi Maeda, "Generation of Gestures During Presentation for Humanoid Robots," IEEE International Conference on Robot and Human Interactive Communication, pp.961-968, Nanjing, China, August 27-31, 2018