ツール比較最終更新日: 2026年5月6日初出: 2026年5月6日

LLMO計測ツール比較｜Profound/Otterly/AthenaHQ で AI 引用率を測る【2026年版】

AI 検索 (ChatGPT/Perplexity/Gemini/Claude) での引用率を計測する LLMO 専用ツールを徹底比較。Profound/Otterly.AI/AthenaHQ/BrightEdge/Conductor 等の機能・料金・精度を整理。

文責: LLMOツール編集部

#LLMO計測#Profound#AIモニタリング#計測ツール

目次（48項目）

はじめに
LLMO 計測がそもそも難しい理由
揺らぎの3層
なぜ手動が長らく標準だったか
LLMO 計測ツールが解決する5つの課題
主要ツール詳細
1. Profound（プロファウンド）
2. Otterly.AI（オッタリー）
3. AthenaHQ（アテナ HQ）
4. BrightEdge AI Catalyst
5. Conductor
6. Peec AI / Goodie / Daydream など新興勢
機能比較表
料金プラン比較
用途別おすすめ
ブランド監視
競合分析
エンタープライズ統合運用
コンテンツ改善ループの自動化
低予算でまず試す
手動計測との併用フロー
推奨フロー
失敗事例から学ぶツール導入のリアル
失敗1: 高額契約してデータを使い切れない
失敗2: KPI が引用率だけになる
失敗3: 計測対象クエリの選定ミス
失敗4: 国・言語の取り違え
ツール選びチェックリスト
自前計測スクリプトのサンプル
ツール導入後の運用設計
体制設計の落とし穴
計測指標のマッピング
2026年の動向と今後の選び方
動向1: SEO 大手の参入
動向2: AI ベンダー自身による分析機能
動向3: マルチモーダル計測
FAQ
Q1. Profound と Otterly.AI のどちらを選ぶべきですか？
Q2. 無料で LLMO 計測する方法はありますか？
Q3. 日本語クエリの計測精度はどのツールが高いですか？
Q4. AI Overviews の計測はどのツールに対応していますか？
Q5. ツールを導入したら順位計測ツールは不要になりますか？
Q6. 自前計測と商用ツールの境界線はどこですか？
Q7. ツールのデータをどの会議で見るべきですか？
Q8. ツールの数値が上下する場合、どこから疑うべきですか？
関連用語・記事
関連用語
関連記事

LLMO計測ツール比較｜Profound/Otterly/AthenaHQ で AI 引用率を測る【2026年版】

この記事の結論: AI 検索の引用率は手動計測では追いきれない量と速度で動いています。Profound/Otterly.AI/AthenaHQ がブランド監視の3強で、エンタープライズは BrightEdge AI Catalyst や Conductor、低予算なら Perplexity API を使った自前計測が現実的です。

最終更新日: 2026-05-06

はじめに

「ChatGPT で自社サービスが引用されているか毎回手で確認するのが限界になった」――そう感じたら、いま検討すべきは LLMO 計測ツールです。本記事では2026年5月時点で利用できる主要ツールを実機検証ベースで比較し、ブランド監視・競合分析・エンタープライズの用途別に最適な組み合わせを提示します。従来のSEOでは順位計測ツールが標準でしたが、LLMO時代は「順位」ではなく「引用」「言及」「ソース掲載」を測る必要があり、ツールカテゴリ自体が刷新されています。

→ 詳しくはLLMOとは？AI検索時代の新SEO【完全入門】

LLMO 計測がそもそも難しい理由

LLMが回答する内容は、ユーザーの質問・前提プロンプト・直近の検索結果・ランダムシードによって毎回揺らぎます。Google 検索のように「クエリ → 順位」が安定して取得できる前提が崩れているため、計測手法そのものを再設計する必要があります。

揺らぎの3層

モデル側の揺らぎ: 同じ質問でも温度パラメータと内部ランキングで毎回回答が変わる
検索層の揺らぎ: ChatGPT search/Perplexity は実検索を裏で叩いており、検索結果のリアルタイム変動を受ける
ユーザー文脈の揺らぎ: アカウント履歴・地域・言語によりパーソナライズされる

3層の揺らぎを「サンプリングと統計」で殴るのが LLMO 計測ツールの基本思想です。手動で1回叩いて「引用された/されなかった」を判定するのは、テストとして粒度が荒すぎます。

→ 詳しくはLLMOのKPI設計と計測方法

なぜ手動が長らく標準だったか

2024年〜2025年前半は、SEO 担当者がスプレッドシートに代表クエリを並べ、毎週手動でChatGPT search・Perplexity・Gemini・Claude を叩いて引用ソースを記録するのが現場標準でした。理由は単純で、専用ツールがそもそも存在しなかったためです。2025年中盤以降、Profound や Otterly.AI が API/UI を整備したことで、ようやく自動計測の選択肢が広がりました。

LLMO 計測ツールが解決する5つの課題

課題	手動計測の限界	ツールが解決する仕組み
サンプル数不足	1クエリ × 1週1回が限界	1クエリ × 数十回サンプリング
揺らぎ補正	「引用された日」「されない日」がばらつく	統計的に引用確率としてレポート
競合比較	自社のみ追跡しがち	競合を同一プロンプトで自動比較
ソース URL の追跡	引用URLを目視で書き写す	API でソース URL とアンカーを自動収集
多言語対応	日英で個別運用が必要	言語切替で同条件比較

要するに、ツールは「サンプリング自動化＋統計化＋ダッシュボード化」をワンストップで提供するための装置です。重要なのは、ツールを入れただけで施策が改善するわけではなく、後段の改善ループ（コンテンツ・PR・構造化データ）と接続して初めて意味を持つ点です。

→ 詳しくはSEOとLLMOの統合戦略

主要ツール詳細

ここから2026年5月時点の主要 LLMO 計測ツールを1つずつ掘り下げます。料金・対応 AI・特色を整理し、選定の判断材料を提供します。

1. Profound（プロファウンド）

Profoundは2024年末にローンチされ、現時点で最も多くのエンタープライズが採用している LLMO 計測ツールです。元 Google・Bain 出身の創業者が率い、Khosla Ventures・Saga Ventures から累計2,000万ドル以上を調達しています。

特徴

対応 AI: ChatGPT/Perplexity/Gemini/Claude/Copilot/Grok の6つを横断計測
サンプリング: 1プロンプトあたり最大100回サンプリングし、引用確率を算出
競合比較: 同一プロンプトで競合ブランドの引用率も自動取得
ソース URL 追跡: 引用された URL とアンカーテキストをダッシュボード化
API: 一部プランで利用可能、データウェアハウスに接続可能

強み

最大の強みはサンプリング精度です。1クエリ100回叩く設計のおかげで、引用確率を「12.4%」のような有意な数値として出せるため、施策後の改善幅が定量で見えます。また、競合分析が標準機能で、自社が「未掲載」のクエリで誰が引用されているかを一覧化できる点が、コンテンツギャップ分析の起点になります。

弱み

価格が高めで、エントリープランでも月額1,000ドル前後と国内中堅企業には重い水準です。日本語クエリの扱いは2026年初頭にようやく改善されましたが、英語比でサンプル品質はまだ若干劣ります。

→ 詳しくはChatGPTで引用される記事の書き方

2. Otterly.AI（オッタリー）

Otterly.AI はオーストリア発の LLMO 計測ツールで、価格帯が比較的低く、SaaS スタートアップや代理店に支持されています。

特徴

対応 AI: ChatGPT/Perplexity/Google AI Overviews/Gemini/Copilot
サンプリング: プロンプトあたり週次サンプリング、頻度はプランで上下
言及・引用・センチメント: ブランドが「引用」されたか、単に「言及」されたか、ポジ/ネガかを分離して計測
GSC 連携: GSC と接続し、AI Overviews 経由のクリック流入を可視化
ローカルブランド対応: 国別ドメインのトラッキング

強み

「引用と単純言及を区別する」設計が明快で、コンテンツ施策のフィードバックに直結しやすい構造です。料金もエントリーで月額29ドルから始められ、まず試したいフェーズには現実的な選択肢になります。AI Overviews への対応が早く、Google 経由の生成 AI 流入を追える点は強みです。

弱み

サンプリング回数は Profound より少なく、揺らぎ補正は若干甘めです。プロダクトの UI 言語は英語中心で、日本語ローカライズはまだ限定的です。

3. AthenaHQ（アテナ HQ）

AthenaHQ はサンフランシスコ発のスタートアップで、Y Combinator 出身。ブランドを「AI に正しく覚えさせる」ことを掲げ、計測＋是正提案までを統合しています。

特徴

対応 AI: ChatGPT/Perplexity/Gemini/Claude
サンプリング: 日次・週次の自動巡回
是正アクション提示: 引用されないクエリに対し「どの記事を強化すべきか」「どの構造化データが不足か」を提示
競合スコア: 業界内シェア・オブ・ボイスを%で算出
チームコラボ: 改善タスクをツール内でアサインできる

強み

計測だけでなく「次に何をすべきか」のレコメンドが具体的で、施策チームに渡すまでの距離が短い設計です。サイト内のE-E-A-Tシグナルが弱い箇所を AI が指摘してくる挙動は、コンテンツチームの作業ガイドとして機能します。

弱み

新興でユーザーベースが小さく、ベンチマークやテンプレが少ないのが現状の不満点です。アクセス可能な API も発展途上で、データウェアハウス連携を求めるエンタープライズには物足りません。

→ 詳しくはE-E-A-TとLLMOの関係

4. BrightEdge AI Catalyst

BrightEdge は SEO エンタープライズ大手で、AI Catalyst という生成 AI 計測モジュールを既存プラットフォームに統合しています。

特徴

対応 AI: ChatGPT/Perplexity/Google AI Overviews/Bing Copilot
既存 SEO データとの統合: 検索順位・トラフィック・コンバージョンと一気通貫で並べて見られる
エンタープライズ機能: SSO/監査ログ/ロール管理/グローバル展開
データウェアハウス: Snowflake/BigQuery 連携あり

強み

既に BrightEdge を契約しているエンタープライズには「追加モジュールで AI 計測まで一気通貫」になる導線が魅力です。SEO と LLMO を同じダッシュボードで管理できるため、レポート粒度の統一が容易です。

弱み

価格は完全に大企業向けで、年間数百万円〜が前提です。スタートアップや個人事業主には不向きです。生成 AI 単体の機能精度では Profound に若干及ばないという声もあります。

5. Conductor

Conductor はもう一つの SEO エンタープライズプラットフォームで、AI Search Insights という機能で生成 AI 計測を提供しています。

特徴

対応 AI: ChatGPT/Perplexity/Gemini/AI Overviews
コンテンツインテリジェンス: 既存コンテンツライブラリと AI 引用データを突き合わせ、LLMO スコアを記事単位で出す
Workflow 統合: コンテンツ計画ツール内で「AI 引用を狙った記事」を計画フェーズから組み立てられる
ロール／チーム連携: 大規模組織でのワークフロー設計に対応

強み

「コンテンツの企画フェーズに AI 検索データを織り込む」運用が組みやすい設計です。SEO 出身チームが LLMO に拡張するときの違和感が少ないのも利点です。

弱み

BrightEdge と同様に価格は重く、PoC を始めるまでに数ヶ月かかるのが通例です。日本市場向けのサポートはまだ限定的です。

6. Peec AI / Goodie / Daydream など新興勢

このカテゴリには毎月のように新興ツールが現れています。Peec AI（ベルリン発）はサンプリング数の透明化を売りにしており、Goodie（米）はマーケター向けに UI を簡素化しています。Daydream はコンテンツ制作と LLMO 計測を統合する方向で開発されています。いずれも2026年中盤に料金や機能が大きく変わる可能性が高く、PoC ベースで触れる程度に留めるのが安全です。

→ 詳しくはPerplexity SEO戦略

機能比較表

主要5ツールを横並びで比較します。価格は2026年5月時点の公開情報をもとにしています。為替や条件で前後するため、正確な数値は各社の最新ページを確認してください。

ツール	対応 AI	競合比較	API	言語サポート	主要レポート
Profound	ChatGPT/Perplexity/Gemini/Claude/Copilot/Grok	あり	プランによる	英＋日（拡充中）	引用率/競合シェア/ソースURL
Otterly.AI	ChatGPT/Perplexity/AI Overviews/Gemini/Copilot	あり	あり（上位）	多言語	引用/言及/センチメント
AthenaHQ	ChatGPT/Perplexity/Gemini/Claude	あり	限定的	英中心	スコア/是正提案
BrightEdge AI Catalyst	ChatGPT/Perplexity/AI Overviews/Copilot	あり	あり（DWH連携）	多言語	統合 SEO ダッシュボード
Conductor	ChatGPT/Perplexity/Gemini/AI Overviews	あり	あり	多言語	コンテンツ × AI 引用

「対応 AI の数」「サンプリング回数」「価格」「日本語対応」の4軸でフィルタすると、自社に必要な選択肢は2〜3個に絞れます。

料金プラン比較

ツール	エントリー	スタンダード	エンタープライズ
Profound	月額約1,000ドル〜	月額数千ドル	カスタム
Otterly.AI	月額 29ドル〜	月額 79ドル〜199ドル	カスタム
AthenaHQ	月額数百ドル	月額 1,000ドル前後	カスタム
BrightEdge AI Catalyst	提供なし（モジュール課金）	既存契約に上乗せ	年契約／要見積
Conductor	提供なし	月額数千ドル相当	年契約／要見積

中小サイトや個人事業主は Otterly.AI の Lite プランから始め、計測対象が増えてきたら Profound に乗り換えるのが現実的なルートです。エンタープライズで既に BrightEdge/Conductor を契約済みなら、まずは追加モジュールを試した上で、特化ツールを並列導入するかを判断しましょう。

→ 詳しくはLLMOのKPI設計と計測方法

用途別おすすめ

ブランド監視

「自社ブランドが各 AI でどう紹介されているか」を継続監視したいなら、Otterly.AI または Profound が第一候補です。Otterly.AI の「ポジ／ネガ／引用／単純言及」の分離は、PR や CS 観点でのアラートに使いやすい設計です。Profound は競合との横並び比較で社内報告の説得力を高めます。

競合分析

特定業界の上位プレイヤーが「どんなクエリで引用されているか」を逆算したいなら、Profound 一択に近い水準です。サンプリング回数が多く、引用ソース URL とアンカーテキストまで取れるため、競合のコンテンツ戦略をリバースエンジニアリングしやすくなります。

エンタープライズ統合運用

複数事業部・複数言語・SSO 必須という条件なら BrightEdge AI Catalyst か Conductor が現実的です。既存 SEO データと統合できる利点は社内政治面でも大きく、LLMO 単体予算を新規取得しなくてよくなります。

コンテンツ改善ループの自動化

「計測 → 何を直すか」までを最短で結びたいなら AthenaHQ が有力です。是正アクション提示が具体的で、コンテンツチームの仕事を1工程減らせる感覚があります。

低予算でまず試す

月額1万円以下で始めたいなら Otterly.AI の最安プランか、自前で Perplexity API を叩く運用が現実解です。後者は技術リソースが必要ですが、計測対象を完全にコントロールできる利点があります。

→ 詳しくはブランドメンションとLLMO

手動計測との併用フロー

ツールを入れたから手動計測を完全にやめてよい、というわけではありません。週次のスポットチェックと組み合わせることで、ツールが拾えない質的情報を補完できます。

推奨フロー

日次: ツールが自動サンプリング → ダッシュボードに引用率を記録
週次: 担当者が代表5クエリを手動で叩き、回答テキストの質と前後文脈を確認
月次: ツールデータと手動データを突き合わせ、ズレが大きいクエリを再サンプリング
四半期: KPI レビューでツール契約の継続・乗り換えを判断

ツールは「定量の網」、手動は「定性のサンプル」として役割分担すると無理がありません。手動で「ChatGPT がブランドをどう紹介しているか」の文章を読み続けるのは、社内のメッセージング修正にも直結する重要な作業です。

観点	ツール計測	手動計測
サンプル数	大量・自動	少数・手動
文脈読解	スコア化のみ	文章の質を読める
コスト	月額固定	人件費
拡張性	高い	低い
アラート	即時	担当者次第

失敗事例から学ぶツール導入のリアル

ツール導入が必ず成功するとは限りません。代表的な失敗パターンを4つ挙げます。

失敗1: 高額契約してデータを使い切れない

エンタープライズプランを年間契約したものの、ダッシュボードを毎週見るのはマーケ担当者1人だけ、改善アクションは何も走っていない――というケースは珍しくありません。導入前に「データを誰が・どの会議で・何の意思決定に使うか」を必ず決めるべきです。

失敗2: KPI が引用率だけになる

引用率を上げる施策（記事追加・FAQ強化）に集中するあまり、本来の事業 KPI（リード・売上）と切り離されてしまうケースです。引用率は中間 KPI に過ぎず、最終 KPI に跳ねるかは別途設計が必要です。

→ 詳しくはLLMOのKPI設計と計測方法

失敗3: 計測対象クエリの選定ミス

「業界一般語」だけ計測して、「指名検索」「比較検索」「How-to」などの粒度別クエリを並べないと、施策の効き目が見えません。クエリ群はカテゴリで設計しましょう。

失敗4: 国・言語の取り違え

英語データだけ見て満足し、日本語データを見ていないケースです。ChatGPT/Perplexity は同じプロンプトでも英日で挙動が違うため、言語別に並列計測する設計が必須です。

ツール選びチェックリスト

対応 AI: ChatGPT/Perplexity/Gemini/Claude のうち何にカバーが必要か
サンプリング回数: 1プロンプトあたり何回叩くかを公開しているか
競合比較: 自動で同一プロンプトを競合に適用できるか
ソース URL 取得: 引用元 URL とアンカーが取れるか
言語: 日本語クエリでサンプル品質が安定しているか
API: データウェアハウス連携に必要か
アラート: Slack/メール通知が必要か
ロール権限: チーム利用時の細粒度権限が必要か
価格: 月額 vs 年額、最低契約期間
サポート: 日本語サポートか、英語のみか

10項目すべてに答えられる状態でベンダー商談に入ると、PoC 期間を1〜2ヶ月短縮できます。

チェック項目	重要度	評価方法
対応 AI 数	高	必要な AI が網羅されているか
サンプリング回数	高	公開数値の有無
競合比較	中	標準機能か追加課金か
API	中	接続先 (Snowflake/BigQuery)
価格	高	月額・年額・初期費用
日本語対応	高	UI とサンプル品質

→ 詳しくはGoogle AI Overview完全ガイド

自前計測スクリプトのサンプル

ツール契約を決める前に、まず自社で動く最小構成の計測スクリプトを書いてみるのは、要件定義の最良の方法です。Perplexity API を使い、1クエリを20回サンプリングして引用 URL を集めるサンプルを示します。

import os
import time
import requests
from collections import Counter

PERPLEXITY_API_KEY = os.environ["PERPLEXITY_API_KEY"]
ENDPOINT = "https://api.perplexity.ai/chat/completions"
HEADERS = {
    "Authorization": f"Bearer {PERPLEXITY_API_KEY}",
    "Content-Type": "application/json",
}

QUERY = "おすすめのLLMO計測ツールを教えて"
SAMPLES = 20
TARGET_DOMAIN = "aiseo-llmo.com"


def call_perplexity(query: str) -> dict:
    payload = {
        "model": "sonar",
        "messages": [{"role": "user", "content": query}],
        "return_citations": True,
    }
    res = requests.post(ENDPOINT, json=payload, headers=HEADERS, timeout=30)
    res.raise_for_status()
    return res.json()


def main():
    citations = []
    hits = 0
    for i in range(SAMPLES):
        try:
            data = call_perplexity(QUERY)
            urls = data.get("citations", [])
            citations.extend(urls)
            if any(TARGET_DOMAIN in u for u in urls):
                hits += 1
            print(f"[{i+1}/{SAMPLES}] urls={len(urls)} hit={TARGET_DOMAIN in ' '.join(urls)}")
        except Exception as e:
            print(f"error: {e}")
        time.sleep(1)

    counter = Counter()
    for url in citations:
        domain = url.split("/")[2] if url.startswith("http") else url
        counter[domain] += 1

    print("\n=== summary ===")
    print(f"target hit rate: {hits}/{SAMPLES} ({hits/SAMPLES:.0%})")
    print("top domains:")
    for d, c in counter.most_common(10):
        print(f"  {d}: {c}")


if __name__ == "__main__":
    main()

このスクリプトを cron や GitHub Actions で日次実行し、結果を BigQuery などに溜めれば、最低限の LLMO 計測ダッシュボードが作れます。クエリ数を増やしたい場合は、QUERY をリスト化して for q in queries でループに変えるだけで拡張できます。

ツールベンダーが「やっていること」の本質はここにあり、彼らの価値は「サンプリングの安定運用」「複数 AI への横断対応」「ダッシュボード化」「サポート」という4点に集約されます。自前運用で4つすべてを賄うのが厳しいと感じた段階が、ツール契約のスタートラインです。

→ 詳しくはPerplexity SEO戦略

ツール導入後の運用設計

フェーズ	アクション	担当
導入直後（1〜2週）	ベースライン引用率の確定	計測担当
1ヶ月目	改善対象クエリの優先順位付け	コンテンツ責任者
2〜3ヶ月目	記事追加／改修と再サンプリング	編集チーム
3〜6ヶ月目	競合比較レポートで意思決定	マーケ責任者
6ヶ月以降	契約継続／乗り換えの判定	経営／マーケ

導入直後にベースラインを取らずに改善を始めると、後から「上がった/下がった」を判定できなくなります。最初の2週は「データを見るだけ」と割り切るのが鉄則です。

体制設計の落とし穴

LLMO 計測は SEO・PR・コンテンツ・広報・CS に分散して影響します。担当者を1人に押し付けると、改善アクションが他チームに流れず形骸化します。週1で30分でいいので、関係チームが集まってツールの数値を一緒に見る場を作りましょう。

→ 詳しくはブランドメンションとLLMO

計測指標のマッピング

LLMO 計測ツールが出す指標と、対応する施策・最終 KPI のマッピングを整理します。

指標	意味	対応施策	最終 KPI
引用率	プロンプトの中で引用された確率	記事追加・FAQ 強化	指名検索数
ソースシェア	引用ソース全体の中でのドメイン比率	構造化データ・E-E-A-T	流入数
競合シェア	競合との並列引用比率	競合より深いコンテンツ	リード
センチメント	言及のポジ/ネガ	PR・カスタマーストーリー	NPS
AI 経由クリック	AI 検索からのクリック数	コンテンツ TOP の最適化	CV

「引用率を上げれば売上が伸びる」のではなく、「引用率→指名検索→流入→CTR→CV」という連鎖の中で各層を別々に最適化する発想が重要です。

→ 詳しくはGoogle AI Overview完全ガイド

2026年の動向と今後の選び方

2026年に入り、LLMO 計測ツール市場は急速に再編しています。注目すべき動向を3つ挙げます。

動向1: SEO 大手の参入

Semrush・Ahrefs などの既存 SEO ツール大手が、AI 検索計測を標準機能として追加してきています。単独カテゴリだった LLMO 計測が、SEO ツールに統合される可能性が高まっています。

動向2: AI ベンダー自身による分析機能

OpenAI・Perplexity がパブリッシャー向けの分析ダッシュボード機能を提供する動きが出ています。GSC のような「公式ツール」が出れば、サードパーティの存在意義はそちらにシフトします。

動向3: マルチモーダル計測

画像生成 AI・動画生成 AI が引用するソースを計測する動きが始まっています。テキスト引用だけでなく、画像説明・動画スクリプト内の言及まで追えるようになると、計測の射程は一気に広がります。

「いま契約するツール」と「半年後に契約するツール」が違う前提で、長期契約は避けるのが安全です。月額契約を中心に、機能変化にあわせて柔軟に乗り換える姿勢を持ちましょう。

→ 詳しくはSEOとLLMOの統合戦略

関連用語

関連記事

SEOツール比較完全ガイド｜Ubersuggest/Ahrefs/Semrush/Moz 徹底比較【2026年版】

AI SEOツールおすすめ10選｜ChatGPT/Claude を活用した SEO 最適化【2026年最新】

AIライティングツール比較｜ChatGPT/Claude/Gemini/NotebookLM/Perplexity【2026年版】