Excelで散布図を多項式近似すると、近似式そのものは簡単に表示できます。しかし、研究や解析で必要になる「係数の標準誤差」はグラフ機能だけでは表示されません。
実は、ExcelのLINEST関数を使うことで、多項式回帰の係数だけでなく、それぞれの標準誤差も求めることが可能です。この記事では、多項式近似における標準誤差の考え方と、Excelで実際に求める方法を分かりやすく解説します。
多項式近似の標準誤差とは?
多項式近似では、例えば2次式なら y=ax²+bx+c のような形でデータを近似します。
このとき、a,b,cそれぞれの係数には「推定誤差」が存在します。そのばらつきの大きさを示すのが「標準誤差」です。
標準誤差が小さいほど、その係数は安定して推定されていると考えられます。
Excelの近似曲線だけでは標準誤差は出ない
Excelのグラフ機能から「近似曲線」を追加すると、多項式近似式やR²値は表示できます。
しかし、この方法では係数の標準誤差やt値、信頼区間などは取得できません。
そのため、統計的な解析をしたい場合は、LINEST関数や分析ツールを使う必要があります。
LINEST関数で多項式回帰を行う方法
多項式回帰は、実際には「x,x²,x³…を説明変数にした重回帰」です。
例えば2次近似なら、次のような説明変数を用意します。
| x | x² | y |
|---|---|---|
| 1 | 1 | 3 |
| 2 | 4 | 5 |
| 3 | 9 | 10 |
そのうえで、次のようにLINEST関数を入力します。
=LINEST(y範囲,x範囲^{1,2},TRUE,TRUE)
配列数式として入力すると、回帰係数と標準誤差が返されます。
「説明変数が独立でないから無理?」について
多項式回帰では、xとx²は確かに相関があります。そのため「独立ではないのでは?」と疑問を持つ人も多いです。
しかし、多項式回帰ではこれは通常のことであり、LINEST関数でも問題なく計算できます。
重要なのは「完全な線形従属」ではないことです。x²はxの定数倍ではないため、回帰計算自体は成立します。
ただし、高次多項式になると多重共線性が強くなり、係数の標準誤差が大きくなる場合があります。
標準誤差の読み方
LINEST関数で statistics=TRUE にすると、1行目に係数、2行目にその標準誤差が返されます。
例えば以下のような結果なら。
| a | b | c |
|---|---|---|
| 2.1 | 1.5 | 0.8 |
| 0.2 | 0.4 | 0.1 |
2行目が各係数の標準誤差です。
a=2.1 ±0.2 のように解釈できます。
より正確に解析したい場合
Excelだけでも基本的な解析は可能ですが、本格的な統計解析ではRやPython、MATLABなどを使うケースもあります。
特に高次多項式やデータ数が少ない場合は、数値不安定性が起きやすいため注意が必要です。
Excelでも十分実用的ですが、解析結果を過信せず残差や近似精度も確認することが大切です。
まとめ
Excelで多項式近似した際の係数の標準誤差は、グラフ機能ではなくLINEST関数を使うことで求められます。
多項式回帰は「x,x²,x³…を説明変数とした重回帰」であり、説明変数同士に相関があっても通常は問題ありません。
ただし高次になるほど多重共線性の影響が強くなるため、係数の解釈には注意が必要です。標準誤差を確認することで、近似式の信頼性をより深く評価できるようになります。


コメント