データドリブンなプロンプト調査・プロンプト検索ボリューム

本日は、新機能を 2 つ公開します。プロンプトリサーチプロンプトボリューム機能です。特にプロンプトボリュームには、私たちなりのこだわりのあるアプローチを取りました。ぜひ本記事をご覧になってください。

1. プロンプトリサーチ

まずはプロンプトリサーチから紹介します。プロンプトを検討するのは、想像以上に骨の折れる作業です。「それっぽい候補がパッと出てくる」という夢のような機能があればいいのですが。

生成 AI を使えばプロンプト候補は無数に湧き出てきます。数百〜数千の候補プロンプトが見つかり、その中から関連性と意味的な近さで絞り込んでいくことになります。

入力ソースも多様です。ドメイン、トピック、CSV や Google Search Console 、カスタマーサポートのデータや、ユーザーフォーラム、掲示板などとの連携も求められるかもしれません。プロンプトリサーチは、この一連の流れを簡略化するものです。

大量の候補取得

「売出中の中古車(used car for sale)」をベースにして実例を紹介しましょう。まずこの検索クエリから、4 系統のプロンプト候補が収集できます。

  • People Also Ask: Google の PAA ボックスから質問文を取得
  • 生成プロンプト: AI 生成した自然言語のプロンプト
  • クエリファンアウト: Google 特許に基づく 7 種類の分類
  • クエリ拡張: より長いロングテールバリエーションの生成
Research:
used car for sale
PROMPTS
2,104
UNIQUE INTENTS
419
TOTAL SV
66.1M
TOTAL AI SV
38.7M
PromptSourceSVAI SVIntent
carfax near meExpansion1,000,000673,100Navigational
used carsSeed673,000393,796Commercial
car dealerships near meExpansion673,000293,196Local
car lots near meExpansion135,00083,016Local
auto dealers near meExpansion73,00043,516Local

「used car for sale」の場合、最終的にプロンプト 2,104 件、ユニーク検索意図 419 件、合計検索ボリューム 6,610 万、合計 AI 検索ボリューム 3,870 万、という規模になりました。かなり大量に集めることができますが、多すぎて困ってしまいますね。絞り込みが必要です。

まずは大雑把な絞り込み

ファンアウトでフィルタすると、選んだタイプに該当するプロンプト群だけの合計検索ボリュームと AI 検索ボリュームに絞り込めます。たとえば「比較系プロンプトだけ」「ステップバイステップ系だけ」を切り出して、規模感を比べる、といった使い方です。

Fan-out: Comparative Entity Expanded Implicit Personalized Recent Reformulation Related Step By Step
TOTAL SV
44,584,490
TOTAL AI SV
26,082,802
AI SEARCH VOLUME TREND
AprMayJunJulAugSepOctNovDecJanFebMar
Copilot ChatGPT Gemini Perplexity Meta DeepSeek Grok

さらに AI 検索ボリュームの月次トレンドチャートが、ChatGPT、Gemini、Copilot、Perplexity、Meta、DeepSeek、Grok の各エンジンごとに色分けで表示されます。「どのエンジンで需要が伸びているか」を、過去 12 か月の時系列で確認できます。こうして候補クエリを絞り込んでいきます。

複数の角度で検索意図を読み解く

アナリティクスタブには 4 つのビューが用意されています。ファンアウトタイプの分布、推奨コンテンツフォーマット、エンティティの出現頻度、エンティティ共起ネットワーク、です。

「used car for sale」だと、1,501件(71%)のプロンプトが商品ページにマッピングされ、トップエンティティは「used cars」「cars sale」「sale near」となっています。つまりこのトピックでは、「中古車そのもの」と「近所で買えるか」がユーザー関心になっている、と一目でわかります。共起ネットワークを使えば、本当に必要なプロンプト群を絞り込むことができるのです。

FAN-OUT TYPE
Entity Expanded1,85988%
Personalized20210%
Comparative281%
Reformulation80%
RECOMMENDED FORMAT
Product Page1,50171%
List43221%
Table1407%
Step By Step211%
TOP ENTITIES
used cars
cars sale
sale near
auto sales
cars under

意味クラスターの活用

Voyage AI という意味ベクトルを使って、各プロンプトを3次元空間に表現しています。意味的に近いプロンプトは近くに集まるため、ソース別、クラスター別、信頼度別でフィルタしながら、トピック空間そのものを視覚的に探索できます。技術的に難しい話をしてしまいましたが、使ってみれば簡単です。

Semantic Clusters All Expansion Seed Synthetic Cluster 2,104 points

日本でも「自社が AI 検索に引用されるための言葉をどう設計するか」という議論が広がっています。プロンプトリサーチは、候補プロンプトをボリュームと意図つきで一気に揃えるためのツール、と捉えていただくとわかりやすいかもしれません。

2. プロンプトボリューム

もう 1 つの新機能プロンプトボリュームをご紹介します。要するにプロンプトの検索ボリュームのようなものですが、私たちが何をどう計算しているのかを、率直にお伝えしておきます。

PROMPT
used car for sale near me with no accidents and one owner
Synthetic
CANONICAL KEYWORD
used cars for sale near me
SV
135,000
AI SV
78,976
Engine SV Keyword Map
Google
135,000
ChatGPT
28,350
Copilot
18,225
Gemini
16,200
Perplexity
5,063
Meta
4,050
DeepSeek
3,038
Claude
2,430
Grok
1,620
Total AI SV: 78,976
Recommended format
list
Fan-out
personalized

クリックストリームベースの限界

現在「プロンプトボリューム」として市場に出回っているデータの多くは、見出しこそ華やかですが、実体はクリックストリームデータを使っているようです。

クリックストリームデータ自体は、用途によっては有用です。ただし、プロンプトボリュームの推定には適していない、というのが私たちの見立てです。理由は 3 つあります。

  • パネルサイズが小さい
  • ノイズが非常に多い
  • 別の LLM が生成したダミーテキストも相当量含まれている

こうした理由から、長い時間をかけて「プロンプトボリューム」の実装を検討してきました。

私たちのアプローチ:Google 検索ボリュームにグラウンディングする

「人が何を探しているか」について、Google ほど膨大なデータを持っている存在は、地球上に他にありません。トピックの需要量を測るうえで、これより地に足のついたソースは存在しない、というのが私たちの判断です。

プロンプトボリュームが行っているのは、任意のテキスト文字列を抽出し、その検索ボリュームを取得する、というシンプルな仕組みです。同時に、各 AI プラットフォームへのトラフィック比率を継続的に計測し、重み付けして合算することで、「どの程度のインパクトが見込めるか」を方向性として示します。

たとえば、「近所で買える、修理歴なしワンオーナーの中古車」のような会話型プロンプト。どこまでも長くなるし、無限のバリエーションが考えられますよね。プロンプトボリュームはこれを、シンプルな文字列に正規化して検索ボリュームを取得しています。こうして、実務で使えるな妥当なデータを生み出すことに成功しました。

ここで強調しておきたいのは、完全に正確な「プロンプトボリューム」は誰にも取得できないということです。私たちの数値も、あくまでも推測です。社内やクライアントに共有する際は、「どのようにしてこの数字が算出されているか」を必ずあわせて説明してください。便利な数字ほど、出自を語らずに使うと事故の元になります。

一般公開は夏頃になる予定です。ぜひ日本でもデータドリブンな AI 検索対応を進めていきましょう。