2026.06.25

社内AIの効果は”利用率”では測れない｜2026年の効果測定とログ分析設計

「社員の8割が生成AIを使っています」——導入の成果を問われた担当者が、まずこの利用率を持ち出す場面は珍しくありません。数字は月を追うごとに伸び、経営層もひとまず満足する。けれども「では業務はどれだけ楽になったのか」と問い直された途端、言葉に詰まってしまう。本稿の立場はシンプルです。利用率は社内AIの効果を測る単独の指標としては、もはや不十分です。測るべきは「どれだけ使われたか」だけではなく「どう使われ、何を生んだか」なのです。

なぜ”利用率”では社内AIの効果が測れないのか

利用率は「ライトユーザーもヘビーユーザーも1人」と数える

利用率という指標には、構造的な欠陥があります。月に一度だけ試しに触れた人も、毎日高度な使い方で業務をこなす人も、同じ「1人の利用者」として合算されてしまうからです[1]。中身を問わないこの数え方では、組織にどれだけ実質的な生産性が生まれたのかは見えてきません。

問題は、この数字が経営層に「順調だ」という感触だけを与えてしまうことです。利用率が9割に届いても、その内訳が「たまに触る人」ばかりなら、業務への効果はほとんど積み上がりません。むしろ高い利用率は、追加投資や運用見直しの必要性を覆い隠し、改善の手を止めてしまう危険すらあります。

利用が広がっても成果は出ない——日本企業の現実

利用が広がること自体は、成果を保証しません。ある大手コンサルティング会社が、売上高500億円以上の企業・組織に勤め生成AI導入に関与する課長職以上を対象に行った6カ国比較調査では、日本の生成AI活用・推進度は2026年春時点で87%に達しました[2]。普及という点では、比較対象の各国と大きな差はない水準です[2]。

ところが「期待を大きく上回る効果を創出した」と答えた企業は9%にとどまり、6カ国で最も低い結果でした（米国38%、英国32%）[2]。さらに、生成AI活用で生まれた効果を、従業員への利益還元や顧客への価格還元といった財務的な還元につなげている割合は日本で40%にとどまり、還元していない割合も19%にのぼります[2]。「使われている」と「効いている」は、まったく別の話なのです。

測るべきは「利用の深さ」と「成果の質」

成果を左右するのは利用の”深さ”

同じ社内AIでも、使い込みの深さによって生まれる成果はまるで違います。先の実態調査では、生成AIの成熟度が高い層は低い層に比べ、業務時間の削減効果が約2.3倍、浮いた時間を付加価値の高い業務へ充てる割合も約1.5倍高いと報告されています[1]。利用したかどうかではなく、どこまで使いこなしたかが効果を分けているのです。

組織の進め方による差も見過ごせません。同調査では、短期的なタスク削減時間は現場任せの組織が週52.2分と最も高い一方、生成AIの成熟度が最も高いのは利用を仕組み化した組織でした。統制を優先した組織では、週あたりの削減はわずか8.7分にとどまります[1]。短期的な効率化は現場の工夫だけでも起こり得ますが、持続的な高度活用には、相談・教育・レビュー・テンプレート更新を組織として回す仕組みが欠かせません。利用率という一枚の数字は、こうした深さと設計の違いを丸ごと覆い隠してしまいます。

効率化が「成果」に変わるとは限らない

時間が浮いても、それが価値へ転換されるとは限りません。同じ調査によれば、生成AI利用時のタスク所要時間は平均16.7%（週26.4分）削減されたものの、総業務時間が実際に減ったと実感できた人は利用者の約4人に1人にとどまりました[1]。タスク単位では速くなっても、それが一日の労働時間の短縮として現れる人は限られているのです。

削減できた時間の使い道にも、見落とされがちな現実があります。浮いた時間のうち仕事に再投下されたのは約6割で、その中身の多くは日常業務（75.4%）が占めていました[1]。つまり、AIで生まれた余白は、より付加価値の高い仕事ではなく、目の前のルーティンに吸い込まれていく傾向があります。

ここに、効果測定の落とし穴があります。「何時間削減できたか」だけを追うと、その浮いた時間が何を生んだのかが視界から消えてしまうのです。削減量はあくまで途中経過にすぎません。測るべきは時間そのものではなく、その時間が新しい価値に変わったかという質の問題です。

利用ログをどう効果測定につなぐか

「誰が・どの業務で・どう使ったか」を突き合わせる

利用の深さと成果の質は、利用ログを起点にすることで可視化しやすくなります。ログから「誰が・どの業務で・どんな問いを・何度繰り返したか」を取り出し、そこにアウトプットの提出物や所要時間、簡単な自己申告を突き合わせる。この組み合わせが、利用率では見えなかった活用の濃淡を浮かび上がらせ、改善の起点になります。

合わせてKPIも、「利用率」「ログイン率」のような代理指標から、コスト削減額や品質・精度の向上といった成果寄りの指標へと組み替える必要があります。こうして測った効果を投資判断の言葉に翻訳する段になれば、AI導入のROIを数値で証明し報告書にまとめる手順が次の一歩になります。実際、生成AI活用・推進担当者111名を対象にしたある調査では、KPIを設定した企業のうち「十分に達成」が23.4%、「おおむね達成」が56.8%で、合わせて80.2%が目標を達成しています[3]。何を測るかを明確に決めることは、成果を管理し、改善の打ち手を具体化する起点になり得ます。

裏を返せば、測る対象が「使ったかどうか」のままでは、改善のハンドルを握れません。たとえば「定型の問い合わせ対応にかかる時間」「再依頼や手戻りの発生率」「特定業務での利用が定着した部署の割合」といった、業務に紐づく指標へと一段ブレークダウンする。測定対象の設計は、効果を後から確認する作業にとどまらず、改善サイクルを回すための先行投資でもあります。

モニタリング基盤と評価設計——実装のギャップを越える

ただし、測る仕組みづくりは多くの企業で道半ばです。同じ調査では、今後モニタリング基盤の構築を検討する企業が54.1%にのぼる一方、AI出力を自動で分析する仕組みにまで踏み込む企業は37.8%にとどまり、意欲と実装の間に明確なギャップが見えます[3]。さらに、KPIを「一部達成できていない」「ほとんど達成できていない」と答えた22名のうち81.8%が、未達の要因として「AI出力の品質・再現性の不安定さ」を挙げています[3]。出力の質がぶれれば、そもそも成果を安定して測ることもできません。

だからこそ、価値・品質・リスクを切り分けて評価する設計が重要になります。これは、優れた成果を出している企業に共通する要素でもあります[2]。社内AIの管理画面で利用状況や対話ログ、出力の傾向を継続的に把握できる環境は、この評価設計を絵に描いた餅で終わらせないための土台です。ログを「監視のため」ではなく「効果を測り、改善を回すため」に使う発想への転換が、ここで問われています。

さいごに

社内AIの効果は、利用率という分かりやすい数字では測れません。利用率は活用の深さも成果の質も覆い隠し、「使われているのに効いていない」状態を見えなくしてしまうからです。

鍵になるのは、利用ログを起点に「誰が・どの業務で・どう使い、何を生んだか」を捉え直し、KPIを成果寄りに組み替えること。そして、その分析を支えるモニタリングと評価の仕組みを地道に整えることです。測り方を変えることは、社内AIを「導入した」から「成果を出す」へと進めるための、確実な第一歩になります。

出典

[1] 利用率では測れない、職場での生成AI活用の実態 / 「生成AIとはたらき方に関する実態調査」を発表 – パーソル総合研究所
[2] 生成AIに関する実態調査2026 春 6カ国比較 – PwC Japanグループ
[3] 【生成AI投資の実態調査】KPI設定企業の80.2%が目標を達成 – クラウドエース株式会社

この記事を書いた人

Yuji Oe

ソリューションサービス事業部

10年以上の業界経験（主にデータベース分野）を生かし、現在はSmart Generative Chatの導入のプロジェクトマネジメントを中心に活動。