これまでの2回(前編/中編)で、私たちはユーザーの言葉の曖昧さから出発し、身体の反応という「一次情報」を捉える生体テストの世界を探検してきました。
カプコンやボルボの事例のように、生体データはすでにデザインの強力な武器となっています。
最終回となる今回は、AIとユーザーテストの融合がもたらす未来を、さらに一歩先まで見据えてみたいと思います。AIの進化は、単なる分析の効率化にとどまりません。ユーザーテストの「被験者」「環境」「分析の質」そのものを根底から変革する、新たな可能性の扉を開こうとしています。

これまで生体テストの導入を阻んできた壁の一つが、専門業者しか持たない「分析のノウハウ」でした。
しかし、ただ、専門のテスト会社に丸投げすれば、それで良いかというと、そういうわけではありません。サービスの本質的な課題を見つけるには、外部の会社では難しく、それにはプロジェクトと長期間、伴走する必要があります。生体テストのような、費用も期間もかかるテストの場合、それは現実的とは言えません。
しかし、その状況はAIによって変わりつつあります。世界中の論文や過去の膨大なテストデータを学習したAIは、私たちが得たデータから、専門家レベルの分析結果やインサイトのヒントを導き出してくれます。
これにより、プロジェクトチームは外部業者に分析を丸投げするのではなく、自らの手でデータと向き合い、より深く、本質的な課題を発見する機会を得られるようになります。AIは、いわば「伴走してくれる超優秀な分析官」として、私たちのテストの質を底上げしてくれるのです。
ユーザーテストの時間とコストが大きくかかってしまう大きな理由は、テストの被験者を探す、ユーザーリクルートにあります。まさにその問題をAIが解決してくれます。
AIが被験者となってユーザーテストが実施できる未来が、すぐそこにきています。
例えば、プロジェクトで設定した「65歳、初めてスマートフォンを使う佐藤さん」というペルソナ情報を生成AIに与えます。するとAIは、佐藤さんとして私たちと対話したり、プロトタイプに対して、どのようにプレイを行ったか、その時の発言などをフィードバックしてくれます。
「このボタンの意味が分かりません」「文字が小さくて読めないのですが...」
AIは、そのペルソナが抱きがちな疑問や、操作でつまずきやすいポイントを、まるで本物の人間のようにシミュレートしてくれます。これにより、デザインの極めて初期段階で、致命的な問題点を洗い出したり、仮説を高速で検証したりすることが可能になります。もちろん、実際のユーザーテストを完全に置き換えるものではありませんが、プロトタイピングの精度を飛躍的に高めることができるようになるでしょう。

テストとして信頼性があるのかという疑念がありますが、スタンフォード大学の調査では、正しい手続きを行うことで、85%の信頼性でAIがシミュレートできたという調査もあります(※)。プロンプトとテストの構築次第では高い精度を出すことができるでしょう。
たとえ、もし精度が60%しかなかったとしても素早く、その場でテストをしてすぐに回答得られるとしたら、網羅性、再現性、効率性という点では実際のテストよりも品質の高いテストが可能であるとも言えます。
しかし、現時点ではAIによるテストにはいくつか目立った問題があります。学習しているデータにバイアスが継承されている可能性があり、人種、性別、文化、社会経済的背景を正しく表現できているとは限りません。
それに、LLM(大規模言語モデル)は学習データに基づいて予測を行うため、既存のパターンや知識から逸脱した、全く新しい創造的なユーザー行動がなく、予期せぬシステムの誤用などを発見しにくいため、ユーザーが思わぬ利用の仕方をしたことで起こる、偶発的な発見が少ないという大きなデメリットもあります。
AIには肉体がないがゆえに、実は本当の意味で何かを理解しているのではなく、理解したフリをしているだけなのです。ポチョムキン問題と呼ばれるこの分かったフリがAI利用における今後の大きな課題と言えます。

しかし、それをリカバーするためのプロンプトも出てきています(※2)。AIのデメリットを理解し、それをリカバーするための発想を持った上で活用するのであれば、AIによる仮想ユーザーテストは現時点でも大きな武器になるはずです。
次に、分析の「質」の革命です。 第2回で「生体データとヒアリングの組み合わせが重要」という話をしましたが、この複雑な分析をAIが代行し、さらに高い次元へと引き上げてくれます。
マルチモーダルAIは、テキスト(発言)、音声(声のトーン)、映像(表情)、そして生体データ(心拍・脳波など)といった、異なる種類の情報をすべて統合的に分析します。(※3)
いくつかの要素を含めて分析するのには高度な知見が必要です。どのようにデータが関係しあうのか、大量のデータから、その複雑な相関を紐解くのであれば、人はAIに敵わないでしょう。相関だけではなく、矛盾さえ、簡単に見つけ出すことができるでしょう。
ユーザーテストには、時々、ターゲットとは異なる人物のデータが混じることがあります。そういった状況をテストをしてもらう側の会社側で見つけるのは簡単ではありません。注意深く丁寧に、データを可視化して、データの中の矛盾に運良く気づけるかどうかです。過去に一度、釣鐘曲線になるはずのデータに山が二つ現れ、その違和感を確認したところ、異なるセグメントのユーザーが一定数混じっていることをテスト会社が認めてくれたことがありました。
AIであれば、すぐにデータの矛盾を発見することができます。 例えば、ユーザーが口では「このデザイン、満足です」と言っていても、生体データと照らし合わせると、AIが「しかし、その瞬間の表情はわずかにこわばり、心拍数も上昇しています。無意識のストレス反応の可能性があります、他のデータの相関から見て、満足ではない可能性がある」と指摘してくれます。 言葉と身体が発する情報の「すれ違い」を捉えることで、ユーザー自身も気づいていない、より深いレベルのインサイトのヒントを得ることができるかもしれません。(※4)
最後に、テストの「環境」の進化です。 物理的なプロトタイプがなくても、現実と瓜二つの仮想空間(デジタルツインやVR)で、ユーザーに製品やサービスを体験してもらうことが可能になります。
例えば、まだ存在しない未来の自動運転車の車内をVRでリアルに再現し、その中での過ごし方をテストする。あるいは、騒がしい駅のホームや、悪天候の路上といった、現実では再現が難しい特定の環境を作り出し、その中でのアプリの使いやすさを検証する。

こうした超・没入型の環境は、生体センサーとの相性も抜群です。すでに、Meta Quest Proではアイトラッキング機能がついており、瞳孔径・まばたき頻度を検知することができます。VRと組み合わせることで、さらにリアルな反応を引き出すことができるでしょう(※5)。物理的な制約から解放され、あらゆる状況を想定した、究極のユーザーテストが実現するのです。
仮想ユーザー、超・読心術、未来の体験...。AIがもたらす新しいテストの可能性は、まるでSFの世界のようです。これらの技術は、私たちの仕事を効率化し、その質を飛躍的に高めてくれる強力なツールとなるでしょう。
しかし、忘れてはならないのは、これらはあくまで「道具」であるということです。 どんなにAIが優れた分析をしても、「なぜユーザーはそう感じるのか?」という問いを立て、その本質を探求し、より良い体験を創造するという最も重要でクリエイティブな役割は、私たちクリエイターに残されます。
ユーザーテストは、完成されたノウハウではありません。 AIという新しい仲間と共に、未知の可能性を切り拓いていける、エキサイティングなフロンティアです。これまでにない体験を作り出すための、大きなイシューがなければ、有意義な答えを得ることはできません。そして問いを作り出す過程を含めた、その冒険を「楽しむ姿勢」こそが、まだ誰も見つけていない「宝」----ユーザーの心を動かす本当に良いデザイン----にたどり着く、唯一の鍵なのではないでしょうか。
※1:Park, J. S., O'Brien, J. C., Cai, C., Fisher, M., Hesse, A. A., Toy, M., ... & Gweon, H. (2023). Generative Agents: Interactive Simulacra of Human Behavior. arXiv preprint arXiv:2304.03442.
※2:Qian, Y., Zhang, W.-N., & Liu, T. (2023). Harnessing the Power of Large Language Models for Empathetic Response Generation: Empirical Investigations and Improvements. Findings of the Association for Computational Linguistics: EMNLP 2023, arXiv:2310.05140
※3:Pantic, M., Valstar, M. F., Rademaker, R., & Maat, L. (2005). Automatic analysis of facial expressions: The state of the art. IEEE Transactions on Pattern Analysis and Machine Intelligence, 27(12), 1845-1861.(表情認識の分野における古典的な論文)
※4:Picard, R. W. (1997). Affective computing. MIT Press.(感情コンピューティングの提唱者による著作)
※5:Schmitt, S., Völkel, S. T., & Dünser, A. (2020). User Experience in Virtual Reality: A Review of Relevant Factors and Research Gaps. Frontiers in Virtual Reality, 1, 575217. (VRにおけるUX研究のレビュー論文)

里宗 巧麻
UI・UXグループ
マネージャー
KLabのクリエイターがゲームを制作・運営で培った技術やノウハウを発信します。
合わせて読みたい
KLabのクリエイターがゲームを制作・運営で培った技術やノウハウを発信します。