不偏分散とは？n-1で割る理由と求め方をわかりやすく解説

不偏分散とは、統計学において、手元にある一部分のデータ（標本）から、その背後にある全体（母集団）のデータのばらつき具合を推測するために用いられる指標です。
通常の分散（標本分散）がデータの個数「n」で割るのに対し、不偏分散は「n-1」で割って計算するのが最大の特徴です。
この「n-1」で割るという操作には、標本から母集団を推測する際に生じる系統的なズレ（偏り）を補正し、より正確な推定値を得るという重要な意味があります。

この記事では、不偏分散の基本的な考え方から、なぜn-1で割るのかという理由、具体的な計算方法までを解説します。

1 不偏分散とは？まずは標本分散との違いを整理
- 1.1 統計学における「分散」の基本的な考え方
- 1.2 不偏分散と標本分散の計算式の違い
2 なぜ不偏分散はn-1で割るのか？その理由をわかりやすく解説
3 不偏分散と標本分散の使い分け【どちらをいつ使う？】
- 3.1 手元にあるデータのばらつきを知りたいときは「標本分散」
- 3.2 データから母集団全体のばらつきを推測したいときは「不偏分散」
4 不偏分散の求め方を3つのステップで解説
5 Excelを使って不偏分散を簡単に計算する方法
- 5.1 VAR.S関数を使えば一発で不偏分散が求められる
6 不偏分散に関するよくある質問
7 まとめ
8 UCWORLDが選ばれる理由
9 関連記事

不偏分散とは？まずは標本分散との違いを整理

不偏分散と標本分散は、どちらもデータのばらつき度合いを示す指標ですが、その目的と計算方法に明確な違いがあります。
標本分散は、あくまで手元にある標本データそのもののばらつきを計算するもので、データの個数「n」で割ります。

一方、不偏分散は、その標本データを用いて、観測できていない母集団全体のばらつきを推定することを目的としており、データの個数から1を引いた「n-1」で割ります。
この定義の違いが、両者の使い分けの鍵となります。

統計学における「分散」の基本的な考え方

統計学における分散とは、データが平均値からどれだけ散らばっているか、そのばらつきの度合いを示す指標です。
分散の値が大きいほどデータは広範囲に散らばっており、小さいほど平均値の周りに密集していることを意味します。

統計学では、調査したい対象の全体（母集団）から一部分のデータ（標本）を抽出し、その標本の性質から母集団全体の性質を推測することが頻繁に行われます。
このとき、標本のばらつきをただ計算するだけでなく、その結果から普遍的な母集団のばらつきをどう正確に推定するかが重要となり、そのために不偏分散という考え方が用いられます。

不偏分散と標本分散の計算式の違い

不偏分散と標本分散の計算式における唯一の違いは、偏差平方和を割る数にあります。
標本分散では、偏差平方和をデータの個数「n」で割ります。
これに対し、不偏分散（記号では$s^2$や$U^2$、不偏分散vなどと表記される）では、偏差平方和を「n-1」で割ります。

この分母の違いにより、同じデータセットから計算しても、不偏分散は標本分散よりもわずかに大きな値となります。
この差が、母集団の分散を推定する際の精度に関わってきます。
なお、r不偏分散という用語は一般的ではありません。

なぜ不偏分散はn-1で割るのか？その理由をわかりやすく解説

不偏分散の計算で、なぜデータの個数「n」ではなく「n-1」という一見不思議な数で割るのでしょうか。
その理由は、手元のデータ（標本）から、その背後にある巨大なデータ全体（母集団）のばらつきを、より正確に推定するためです。

もし標本データから計算した分散をそのまま母集団の分散の推定値とすると、少しだけ小さく見積もってしまう傾向（偏り）が生じます。
分母を「n-1」とすることで、この偏りを補正し、母集団の分散のより良い推定値を得ることができます。

目的は「母集団の分散」をより正確に推定するため

不偏分散を用いる最大の目的は、手元にある限られた標本データから、知ることのできない母集団全体の分散を、できるだけ正確に推定することにあります。
統計的推測の世界では、標本から得た情報をもとに母集団のパラメータ（母平均、母分散など）を推測します。

このとき、推定値に系統的なズレ（偏り、バイアス）がないことが望ましいとされます。
標本分散をそのまま使うと、母分散よりも少し小さい値になりがちという偏りが生じます。
そこで、この偏りをなくし、期待値が母分散と一致するように設計されたのが不偏分散であり、そのための工夫が「n-1」で割るという計算方法なのです。

標本分散（nで割る計算）では値が少し小さくなる傾向がある

標本データを使って分散を計算する際、基準となる平均値には「標本平均」が用いられます。
この標本平均は、あくまでその標本データにとっての「中心」であり、ばらつき（偏差平方和）が最も小さくなるように計算された値です。

もし、本来比較すべきである「母平均」が分かっていれば、それを使って分散を計算することで、より適切な値が得られます。
しかし、母平均は未知であることがほとんどです。
そのため、標本平均を使って計算した標本分散は、真の母分散に比べて系統的に少しだけ小さい値になる傾向、すなわち過小評価してしまう偏り（バイアス）を持ってしまうのです。

分母を「n-1」にすることで推定値のズレを補正する

標本分散が母分散よりも小さくなる傾向を補正するために、分母をデータの個数「n」から「n-1」へと変更します。
分母を少し小さくすることで、割り算の結果である分散の値は少しだけ大きくなります。
このわずかな調整によって、標本分散が持っていた過小評価の偏りがちょうど打ち消され、計算された値の期待値が母分散と一致するようになります。

このような性質を「不偏性」と呼び、不偏分散は母分散の「不偏推定量」であると言われます。
つまり、「n-1」で割ることは、標本平均を使うことによって生じる推定値のズレを修正するための数学的な操作なのです。

不偏分散と標本分散の使い分け【どちらをいつ使う？】

不偏分散と標本分散のどちらを使用するかは、データ分析の目的によって決まります。
もし、手元にあるデータセットそのものの特徴を記述したいだけであれば「標本分散」を、そのデータを使ってより大きな集団全体の性質を推測したいのであれば「不偏分散」を選びます。

つまり、分析のスコープがデータの記述に留まるのか、あるいは全体への推測にまで及ぶのかが、使い分けの判断基準となります。
実務的なデータ分析、特に推測統計の文脈では不偏分散が用いられるのが一般的です。

手元にあるデータのばらつきを知りたいときは「標本分散」

分析の目的が、集めたデータそのものの特徴を把握すること（記述統計）に限定される場合は、標本分散を用います。
例えば、あるクラス30人のテスト結果のばらつきを調べる、特定部署の従業員の年齢構成の散らばり具合を確認するなど、その集団を全体とみなし、他の集団への般化や推測を考えない状況がこれに該当します。

この場合、母集団を推定する必要がないため、偏りを補正する必要もありません。
したがって、データの個数「n」で割ることで、手元にあるデータの平均的なばらつきを素直に計算する標本分散が適切です。

「日本国内のデータという『標本』から、世界という『母集団』を正しく推測するために、当社の知見をぜひお役立てください。
詳しくは、UCWORLDの海外向けデジタルマーケティング支援をご覧ください。

データから母集団全体のばらつきを推測したいときは「不偏分散」

手元にある標本データが、より大きな母集団から無作為に抽出された一部であり、その標本から母集団全体のばらつきを推測したい場合（推測統計）には、不偏分散を使用します。

例えば、ある工場で生産された製品の中から数十個を抜き取って品質のばらつきを検査し、工場全体の品質管理状況を評価する場合や、全国の有権者の中から1000人を対象に世論調査を行い、有権者全体の意見のばらつきを推定する場合などがこれにあたります。

このような場面では、標本分散が持つ過小評価の偏りを補正する必要があるため、「n-1」で割る不偏分散が用いられます。

不偏分散の求め方を3つのステップで解説

不偏分散の計算は、複雑に見えるかもしれませんが、手順を分解すれば理解しやすくなります。
基本的には、データの中心である平均値を求め、各データが平均からどれだけ離れているか（偏差）を計算して合計し、最後にその合計値を「データの数-1」で割る、という3つのステップで構成されます。

この手順を踏むことで、標本データから母集団の分散を偏りなく推定することが可能になります。
以下で、各ステップを具体的に見ていきましょう。

ステップ1：標本データの平均値を計算する

不偏分散を求めるための最初のステップは、標本データの平均値を算出することです。
平均値は、データの中心がどこにあるかを示す基本的な統計量であり、分散を計算する上での基準点となります。
計算方法は非常にシンプルで、すべてのデータの値を合計し、その合計値をデータの個数「n」で割るだけです。

例えば、データが「2,4,6,8」の4つであれば、合計は20となり、データの個数4で割るため、平均値は5と計算されます。
この平均値が、次のステップで各データとの差を計算する際の基準となります。

ステップ2：各データと平均値の差（偏差）を二乗し、合計する

次に、ステップ1で計算した平均値を使って、各データが平均値からどれだけ離れているかを示す「偏差」を求めます。
偏差は「各データの値-平均値」で計算します。
その後、各偏差を二乗します。

二乗する理由は、偏差にはプラスとマイナスの値が混在しており、そのまま合計すると互いに打ち消し合ってゼロになってしまうため、すべての値を正の数に揃えるためです。

そして、すべてのデータについて計算した偏差の二乗を合計します。
この合計値は「偏差平方和」と呼ばれ、データ全体のばらつきの総量を示しています。

ステップ3：ステップ2の合計値を「データの数-1」で割る

最後のステップとして、ステップ2で算出した偏差平方和を「データの数-1」、すなわち「n-1」で割ります。
この計算によって得られた値が不偏分散です。
標本分散がデータの数「n」で割るのに対し、不偏分散では「n-1」で割ることが最も重要なポイントです。

この操作により、標本平均を用いることで生じる分散の過小評価が補正され、母集団の分散に対するより正確な推定値が得られます。
例えば、データの数が4つであれば、偏差平方和を「4-1=3」で割ることで、不偏分散が算出されます。

Excelを使って不偏分散を簡単に計算する方法

統計計算を手作業で行うのは手間がかかりますが、表計算ソフトのExcelを利用すれば、不偏分散を非常に簡単に求めることができます。
Excelには統計計算用の関数が多数用意されており、不偏分散を計算するための専用の関数も存在します。

この関数を使えば、前述したようなステップバイステップの計算を自分で行う必要はなく、データ範囲を指定するだけで一瞬にして結果を得ることが可能です。
これにより、計算ミスを防ぎ、効率的にデータ分析を進めることができます。

VAR.S関数を使えば一発で不偏分散が求められる

Excelで不偏分散を計算するには、「VAR.S」関数を使用します。
関数名の「S」は「Sample（標本）」を意味し、標本データから母集団の分散を推定する（つまりn-1で割る）計算を行うことを示しています。
使い方は非常に簡単で、計算したいデータが入力されているセル範囲を引数として指定するだけです。
例えば、セルA1からA10にデータが入力されている場合、任意のセルに「=VAR.S(A1:A10)」と入力してEnterキーを押せば、不偏分散の値が算出されます。

なお、Excelには標本分散（nで割る）を計算する「VAR.P」関数（PはPopulationの略）も用意されているため、目的に応じて使い分ける必要があります。

不偏分散に関するよくある質問

不偏分散について学ぶ中で、特に標本分散との使い分けや、n-1で割る理由の背景など、いくつかの疑問が生じやすいポイントがあります。
ここでは、そうした不偏分散に関するよくある質問を取り上げ、Q&A形式で簡潔に解説します。
これらの疑問を解消することで、不偏分散の概念とその統計的な意義について、より深い理解を得ることができるでしょう。

Q1. 結局、不偏分散と標本分散はどちらを使うべきですか？

分析の目的によって使い分けます。
手元のデータそのもののばらつきを知りたいだけなら「標本分散」、そのデータから母集団全体のばらつきを推測したい場合は「不偏分散」を使用してください。

統計的な推測を行う多くの場面では、不偏分散を用いるのが一般的です。

Q2. なぜ標本平均を使うと分散の計算結果は小さくなるのですか？

標本平均は、その標本データのばらつき（偏差平方和）が最小になる値だからです。
もし真の母平均を使って計算すればこのような問題は起きませんが、母平均は未知です。

そのため、標本にとって都合の良い中心点である標本平均を使うと、分散の値が本来より過小評価される傾向があります。

Q3. 不偏分散の平方根をとれば「不偏標準偏差」になりますか？

いいえ、厳密には「不偏標準偏差」にはなりません。
不偏分散の平方根を計算しても、その期待値は母標準偏差と完全には一致せず、わずかな偏りが残ります。

しかし、この偏りは比較的小さいため、実用上は不偏分散の正の平方根を標準偏差の推定値として用いることが一般的です。

まとめ

不偏分散は、手元の標本データから母集団全体の分散を偏りなく推定するために用いられる統計量です。
その最大の特徴は、分散を計算する際にデータの個数「n」ではなく「n-1」で割る点にあります。

この「n-1」で割る操作は、標本平均を用いて分散を計算すると生じてしまう「母分散より少し小さくなる」という系統的なズレを補正する役割を果たします。
分析の目的が手元のデータの記述にある場合は標本分散（nで割る）を、母集団への推測を目的とする場合は不偏分散（n-1で割る）を使用するという使い分けが重要です。

UCWORLDが選ばれる理由

UCWORLDによる伴走型マーケティング支援 — 正確なデータが、確かな信頼を創る

不偏分散の世界で「n-1」という操作が、標本の小さな偏りを正し、巨大な母集団の真実を導き出すように。
私たちUCWORLDもまた、WEBという広大な海において、企業の「真の価値」を曇らせるノイズを正すプロフェッショナルです。

統計学において、計算式一つで結果が過小評価されてしまうように、現代の検索エンジンでも「わずかな情報の歪み」が、企業のブランドイメージを劇的に変えてしまいます。
例えば、たった数件のネガティブな検索サジェスト。それは統計学における「偏った標本」と同じです。

しかし、その「たった数件」がユーザーの目に触れた瞬間、それは企業全体のイメージとして固定化されてしまいます。
総務省の「インターネット上の違法・有害情報への対応に関する調査研究」でも示唆されている通り、一度ネット上に定着した負の印象は、放置すればするほど深刻な経営リスクへと発展します。

私たちは、この「デジタル上の不偏性」を取り戻すために存在しています。検索エンジンのアルゴリズムという複雑な数式を読み解き、不当に歪められた検索結果やサジェストを、本来あるべき「中立で正しい姿」へと補正します。

多くのマーケティング会社は「数字の改善」を謳います。
しかし、私たちはその先にある「担当者様の心の平穏」と「企業の社会的信頼」を何よりも大切にしています。

不偏分散が「期待値を母分散に一致させる」ことを目的とするように、私たちの対策は、ユーザーが抱く期待と、貴社が提供するサービスの真価を一致させるためのものです。
一時的なキーワード削除に留まらず、なぜそのノイズが発生したのかという根本原因をSEOの観点から分析し、再発を防ぐ強固なブランド防壁を築き上げます。

「何から手をつければいいかわからない」「データの海に溺れて、真実が見えなくなっている」
そんな不安を抱えるマーケティング担当者様の隣で、私たちは「n-1」の補正のような、繊細かつ確実な一手を提供し続けます。

私たちのサービスは、決して安価な「お掃除」ではありません。
それは、貴社が何年もかけて積み上げてきたブランドという資産を、守り抜くための「未来への投資」です。
確かなロジックと、数多くの企業の危機を救ってきた実績。 UCWORLDが、貴社のWEB戦略における「不偏のパートナー」となります。

・SNSのデメリットとは？企業運用におけるリスクと対策を事例で解説

・SNS炎上【2025年最新】企業の事例と原因・リスク対策を解説

・マーケティング戦略とは？立案手順からフレームワーク、成功事例まで解説