AIが食べるデータとは?
― 「AI Feed®」が描く未来の話 ―
AIエージェントやLLM(大規模言語モデル)が日々進化するなかで、AIがちゃんと働くには、良い“データ飼料”が必要だということを知っていますか?
商品データ活用から始まった「AI Feed®」という新プロジェクト。今回、データ構築の現場から開発、事業化までを担う推進メンバーが、その内容と未来の話を語ります。

なぜ「AI Feed®」が生まれたのか
――商品データベースから始まった構想

本日は、「AI Feed®」の立ち上げメンバーである皆さんと、その背景から今後の展望までを、ざっくばらんにお話していきたいと思います。まずは、そもそも「AI Feed®」って何? というところからですが、この構想っていつ頃から動き始めていたのですか?

私達は、創業当時(2000年)からドラッグストアで扱う商品情報を、3300社以上のメーカー様から情報提供いただき、年間約5万3000商品を共通の定義でデータベース化してきたんです。医薬品や化粧品といった情報価値の高い商品からスタートし、現在では日用品や食品までカバーするようになっています。


そうですね。その流れで、2012年頃から「データをどう生かすか」という観点で、POSデータやプロファイルデータとの連携を進めてきました。2016年には「AlphaGo(※1)」の衝撃もあって、「これからはAIの時代が本当に来るぞ!」と。実は、「AI Feed®」の原点は2016年ごろの社内議論なんです。当時、AIや機械学習を活用したレコメンドやマッチングが主流になると見据えて、「じゃあ、そのAIが学ぶためには、どんなデータが必要か?」という話になっていきました。


当時からReNUビジネスでは、ドラッグストア向けのクーポン配信サービスなどで機械学習を活用し、どうすれば成果が出るかを現場で試行錯誤してきたんです。だからこそ、AIがちゃんと働くには、“意味のあるタグが整った商品データ”が必要になるという実感はありました。


あのときのクーポンの精度は、本当にすごかったですもんね。

レコメンド機能は、データサイエンティストや機械学習等の専門家とタッグを組んだことで飛躍的な進化を遂げました。さらに、東大をはじめとする国立大学で機械学習や統計を専門にしていた人たちをグループに迎え、彼らの力を借りて、「教師データ(※2)としてのデータ設計」を体系化していく中で、「AI Feed®」という形が固まっていったんです。


こうして、自分たちの得意なドメインでAIがちゃんと働くために“必要なデータ飼料”を提供できる組織になろう、単なる分析や開発ではなく、“データを整える側”として価値を出そうという方向性ができたんですよ。

- ※1 AlphaGo(アルファ碁)は、グーグル社傘下のディープマインド社が開発した囲碁AI。
- ※2 教師データ:AIが機械学習に利用する例題と正解のペアのデータで、教師あり学習に必要なもの。
AI時代の“データ飼料”をどう育てるか
――「AI Feed®」の中身とこだわり

ここからは、もう少しプロジェクトの中身や、実際にどんな工夫をしているかを深掘りしたいと思います。「商品データにタグをつける」って、具体的にはどういうことですか?


私たちは、メーカー様と直接やり取りして、商品情報を収集しています。しかも、単に集めるだけじゃなくて、カテゴリやブランド、機能性といった“タグ”をつける作業まで、一貫して行っているのです。“タグ”や“属性情報”って、もともとは人間の管理のためのものでしたけれど、今やそれがAIの理解力を支える“意味の単位”になってきました。私たちは、その粒度や構造をちゃんと設計して、生成AIの文脈でも使える形にしているんですよ。


この“タグ”は、いわばAIが内容を理解するためのヒントなんですよ。「この商品は敏感肌向けですよ」とか、「カロリー控えめです」とか、そういったメタ情報ですね。生成AIやLLMを使ったレコメンドや検索って、この粒度の情報があるかどうかで精度が全然違ってきますし、生成される情報も高度になるんです。


だから“タグ設計”がキーになってくるんですね。

まさに、そうです。AIにとって“タグ”はただの飾りじゃなくて、栄養バランスのあるレシピみたいなもの。どの属性を重視するかで結果が変わるので、目的に応じて整理の仕方を変えています。


それに、私たちは実際に自社でAI活用をやっているので、「このタグのつけ方じゃ精度が出なかった」とか「こう分類した方がいい」っていうリアルな知見がどんどんたまるんですよ。それを“使える形”にして整備していくのが、「AI Feed®」のもう一つのポイントですね。


現場で使っているからこそ、理論じゃなくて“使える形”で蓄積されているのが強みなんですね。

そのとおりです。整備だけでなく、そもそも「どの属性情報が必要か」も考えますし、整備の運用設計も含めてやっている点が、単なるデータレイク(※3)とは違うところです。
- ※3 データレイク:構造化データと非構造化データをそのまま格納できる情報の格納庫。
さまざまな立場でつながるユニット
――「AI Feed®」の舞台裏

そもそもこのプロジェクト、メンバーそれぞれに立場が違いますよね。

そうですね。このプロジェクトは、データベースやエンジニア、サービス担当といった異なる立場が連携してこそ価値が出るものなので、毎月スプリントを切って、知見を持ち寄る場をつくっています。


データベース側はメーカーさんとの窓口も多く、商品データを整備していく運用を日々行っているので、どのタイミングでどんなどんなタグや属性が必要か、現場の肌感覚と精度の観点のバランスを見ながら連携しています。

私は事業推進側として、社内での実証やクライアントへの展開を支援していて、タグや属性の考え方を「どう見せるか」「どう伝わるか」って視点で重要になってくることを感じています。

このプロジェクトって、ただの“データ整備”じゃなくて、“生活者と企業のあいだをつなぐ”橋渡しでもあるんですよね。だからこそ、さまざまな立場の人の生きた経験や言葉が必要なんです。


そうなんです。AIを活用するチームと連携して「このタグだと精度が落ちる」といったフィードバックももらえるのは、社内で活用しているからこその強みですよね。

現場やお客様の声と向き合う人が、それぞれの角度から支えているプロジェクトチームなんですよね。

生成AIがこれほど発展する前から、DeepLearning(※4)を使って、画像と特徴コメントからタグを自動生成する実験を進めていたのも経験値として積みあがってますね。これからも技術が革新される中、データサイエンスの側面でのフォローを意識したいですね。
- ※4 Deep Learning(深層学習):複雑なデータ構造を多層の処理で表現・解析する、機械学習の手法のひとつ。
LLMとつながってはじめて武器になる
――見えはじめた成果と手応え

ここからは、「AI Feed®」の成果や手応えについて、お話したいと思います。最近、生成AIやLLMと組み合わせた活用も増えていますよね?

とくに社内で検証中のプロジェクトで、「AI Feed®」の“タグ構成”によって結果が大きく変わることがわかってきました。


社内で生成AI関連の取り組みがいくつも進んでいるんですが、それらが全部、同じデータを使っているわけじゃないんですよね。チームごとに目的が違うから、使いたいタグの粒度も違う。そこがすごく面白いし、実はここが「AI Feed®」の核心なんです!

つまり「どんな目的でAIを使うか」によって、必要なタグの構成が変わるってことですね。


はい、まさに。だから「共通Feedを提供する」っていう考え方ではなく、目的や用途に応じて、組み合わせたり、範囲を区切ったりすることができる設計になっているのが「AI Feed®」の特長です。

現場でも、その違いを実感しています。ReNUでは、機械学習によって「誰に、いつ、何を」リコメンドするかという“最適化”に取り組んできたんですが、LLMと組み合わせたときに、従来のロジック以上に“タグの意味”が問われるんですよね。


どのようなタグを持っているかによって、AIがリコメンドする生成コンテンツの精度も大きく変わってきますしね。

タグって、構造データでありながら“コンテキストの塊”でもあるので、LLMはそこからデータを生成するわけです。だからこそ、タグ設計がAIの出力そのものを左右する時代に入ってきていると感じます。

社内で横断的にフィードバックループが回っているのも良い点ですね。タグや属性に関する提案が現場から上がってくるし、それを整備側が吸収して、また新しいFeedが生まれる。そうやって質がどんどん高まっています。

Feed自体が“進化していく”って、まさに生きたプロジェクトですね。
データを生成する「未来」へ
――「AI Feed®」が見据える次の展開

さて、いよいよ最後のテーマです。今後どこに向かっていくのか、「未来」について語りたいと思います。


一番大きいのは、“データを使う未来”から、“データを生成する未来”への移行だと思っています。これまでは人が使うデータを設計していましたが、今はAIが使うデータ——もっと言えば、「AIが生み出す価値を最大化するための“データの設計”」が求められているんですよね。

LLM時代のデータ設計、ですね。

「AI Feed®」では、「このFeedがあれば、どんな生成物が得られるか?」を見据えて設計していきたい。しかも一種類じゃなくて、目的別・役割別に“配合できるFeedを持つことが重要だと思っています。

タグも、一度つけて終わりじゃなくて、生成AIの活用が進めば進むほど、「こういう情報があると便利」「こう切るともっとわかりやすい」みたいな声がどんどん増えてくる。進化するFeedという感覚をもっています。


まさに、静的なデータじゃなくて「学習するデータ」なんですね。

そうなってくると、もはや“環境”に近いのかもしれません。生成AIを育てる場、というか。

こういう設計って、社内だけでやるより、「AIを使って新しい体験をつくろうとしている企業」と一緒にやるのが一番良いんです。「AI Feed®」が、そういうパートナーとつながるための共通基盤になっていけたら、すごく嬉しいですね。


社内の実証実験だけじゃなくて、本当に生成AIでサービスを変えたい、体験を変えたいと思っている人たちと手を組んで、現実の成果にしていきたいです。





