2019.5.29 (水)

「AI人財、社内育成の秘訣とは」 キカガク×ABEJA共催セミナーレポート後編

  • Solution
  • レポート

前回よりお届けしているキカガク×ABEJA共催セミナーレポート、後編です。

セミナー後半では、AIによる価値の創造のために顧客と並走してきたABEJA マーケティングの鵜木から、AI人材を「社内に」持つことの重要性について、プロジェクトの成功のためにクリアしなければいけないビジネスとテクノロジー両サイドからのポイントを踏まえつつ語られました。

◾️登壇者プロフィール
鵜木 彩(うのき あや)
株式会社ABEJA Marketing
日本ロレアル株式会社のコンシューマープロダクツ事業本部にてヘアカラー・ヘアケアのプロダクトマーケティングに従事。その後、ソーダストリーム株式会社にてECを中心とするデジタルマーケティング、インストアマーケティング、製品開発を担当。2016年3月より株式会社ABEJAでカスタマーサクセスを担当後、製造業や小売業を対象としたマーケティングを担当。

あらゆる場面で必要とされる
ビジネス×テクノロジーの知見

鵜木:ビジネス面の具体的な論点(図1)としては、課題設定はもちろん費用対効果を測るためのROI、社内でどのようなデータを持っているのか、ゴールはどこなのか。そのためにマイルストーンはどこに置くべきか、などが挙げられます。
テクノロジー面に関しても、理解しておかなければいけないことが多くあります。開発をベンダーに依頼する際の要件定義書の設計や法的視点、どのようなデータを揃えるべきか、導入後に何かすることはあるのか、AIの得手不得手など。
このような多くの点を一つひとつクリアしていかなければならないため、社内にAI人材が必要なのです。

図1:ビジネスとテクノロジーが掛け合わされて初めてプロジェクトが成功する

これらの論点から、特に重要なポイント4点について具体的に説明がありました。

鵜木:ひとつ目は課題設定です。
課題設定をする際に、AIの得手不得手(図2)を知らなければROIが合わなくなることがあります。例えば、AIは100%の精度が必要な課題を解くのは苦手であるため、そこにAIを適用しようとすれば巨額の投資が必要になってしまうかもしれません。

図2: AIの得手不得手

また、AIはその技術特性から、導入にかかる投資期間が他の技術よりも長いという特徴がありますが、その一方で、横展開しやすくレバレッジを効かせやすい技術でもあります。そのため、指数関数的に利益が拡大する部分に集中して課題設定をする方が利益を得やすいと言えるでしょう。
このように、プロジェクトの初期段階で行う課題設定を誤ると一向に結果に結びつかないため、ビジネスとテクノロジー両方の論点をクリアして課題設定を行う必要があるのです。

2つ目に重要なポイントはデータであり、AI実装までの技術的なプロセスの中で、モデル設計よりも重要だと言います。

鵜木:ディープラーニングはその技術特性上、大量のデータを学習させることによってモデルが賢くなっていきます。裏を返せばデータがなければ何もできないため、プロジェクトの成否を決めるのはデータ(図3)と言っても過言ではありません。

図3: プロジェクトの成否を決めるのはデータ

しかしながら、単に大量のデータがあれば良いというわけではありません。AIが読みやすい良質なデータを作ることが重要です。データに対し対象物をラベリングをする、AIのための教科書を作る作業—アノテーションをする必要があります。
それでは、AIを活用したい課題が工業部品の検品作業だった場合、誰がラベリングをしたら最も良質なデータができるか。その部品に対する専門知識を持っている熟練工です。
熟練工の方々へ大量のラベリングをお願いする際、なぜその作業が必要なのかを説明し、現場とエンジニアの仲介をする役割が必要なことは、皆さんも容易に想像がつくのではないでしょうか。
また、物体認識のデータセットを作る際にも、撮像環境をどのように現場に近づけるのか、何枚データが必要か、対象物と対比させるためのデータが必要かどうかなど、留意しなければいけない点がいくつかあります。
このように、データを用意するということひとつをとっても、技術と事業両方の理解が必要なのです。

ディープラーニングならではの特徴を
理解した設計の重要性

RFP設計(要件定義)については、ディープラーニングの特徴を踏まえていないともう一度初めからすり合わせをしなければならなくなる場合もある、と鵜木は言います。

鵜木:AIという技術は精度保証ができないという特徴があります。
AlphaGoを思い出していただきたいのですが、なぜその一手が出るのか、優秀なエンジニアでも答えることはできません。大量のデータを読み込ませてスパコンで計算させたらこうなりました、としか答えられないのです。
ディープラーニングというのはそういうもので、人間より正確に動くものの、その原理は人間には理解できないという特徴があります。
この特徴を踏まえずに、90%以上の精度を目指したい、というお話をいただくことがよくありますが、何を90%にしたいのか、という論点が抜けている場合が多くあります。
そのため、精度についてはメトリクス(図4)を使ってお話をさせていただいています。

図4: 左上から時計周りでそれぞれTrue positive / False Negative/ True negative / False positiveの略

例えば、不良品検知のプロジェクトで、不良品の見逃しだけは絶対に避けたいとします。
その場合、TPの精度を高めることを最も優先するべきです。
この論点を見逃してしまうと、不良品の見逃しが時々発生してしまい、現場ではとても使えないシステムができ上がってしまうことになります。

4つ目のポイントは導入後の運用体制について。
納品後も運用上取れてくるデータを使い定期的に再学習をかける必要があるそうです。

鵜木:再学習をかけないと、新しいキズを検知できない不良品検知モデルや、新商品を認識しない商品仕分けモデルができ上がってしまいます。
プロジェクト全体の絵を描く時に、再学習の工程も含めた運用設計ができる人材が社内にいないため、導入後半年経った時に全く使えないモデルになってしまうということが実際に発生しています。
少し長いスパンの話にはなりますが、完全自動化の検品システムを作りたいと思っても、一番最初の運用段階でそれができ上がっているケースはまずないでしょう。
基本的には次のようなステップ(図5)を辿ります。

図5: 導入後のステップ

まずはデータを蓄積し、次にステップ2 標準化→高度化という段階へ移ります。
不良品検知モデルであれば、絶対に問題ないものは除き、少しでも疑いの余地があるものは人の判断を仰ぐ。ステップ2でもデータを蓄積していき、そのデータを活用しながら最終的に自動化のステップに移行します。
このようなステップを辿るということをプロジェクトチームが認識していないと、最終的に費用対効果が見合わないという問題が起きてしまうことを、事前に理解しておく必要があります。

SHARE