Excelで多項式近似したときの係数の標準誤差を求める方法|LINEST関数での計算手順を解説

Excel

Excelで散布図を多項式近似すると、近似式そのものは簡単に表示できます。しかし、研究や解析で必要になる「係数の標準誤差」はグラフ機能だけでは表示されません。

実は、ExcelのLINEST関数を使うことで、多項式回帰の係数だけでなく、それぞれの標準誤差も求めることが可能です。この記事では、多項式近似における標準誤差の考え方と、Excelで実際に求める方法を分かりやすく解説します。

多項式近似の標準誤差とは?

多項式近似では、例えば2次式なら y=ax²+bx+c のような形でデータを近似します。

このとき、a,b,cそれぞれの係数には「推定誤差」が存在します。そのばらつきの大きさを示すのが「標準誤差」です。

標準誤差が小さいほど、その係数は安定して推定されていると考えられます。

Excelの近似曲線だけでは標準誤差は出ない

Excelのグラフ機能から「近似曲線」を追加すると、多項式近似式やR²値は表示できます。

しかし、この方法では係数の標準誤差やt値、信頼区間などは取得できません。

そのため、統計的な解析をしたい場合は、LINEST関数や分析ツールを使う必要があります。

LINEST関数で多項式回帰を行う方法

多項式回帰は、実際には「x,x²,x³…を説明変数にした重回帰」です。

例えば2次近似なら、次のような説明変数を用意します。

x y
1 1 3
2 4 5
3 9 10

そのうえで、次のようにLINEST関数を入力します。

=LINEST(y範囲,x範囲^{1,2},TRUE,TRUE)

配列数式として入力すると、回帰係数と標準誤差が返されます。

「説明変数が独立でないから無理?」について

多項式回帰では、xとx²は確かに相関があります。そのため「独立ではないのでは?」と疑問を持つ人も多いです。

しかし、多項式回帰ではこれは通常のことであり、LINEST関数でも問題なく計算できます。

重要なのは「完全な線形従属」ではないことです。x²はxの定数倍ではないため、回帰計算自体は成立します。

ただし、高次多項式になると多重共線性が強くなり、係数の標準誤差が大きくなる場合があります。

標準誤差の読み方

LINEST関数で statistics=TRUE にすると、1行目に係数、2行目にその標準誤差が返されます。

例えば以下のような結果なら。

a b c
2.1 1.5 0.8
0.2 0.4 0.1

2行目が各係数の標準誤差です。

a=2.1 ±0.2 のように解釈できます。

より正確に解析したい場合

Excelだけでも基本的な解析は可能ですが、本格的な統計解析ではRやPython、MATLABなどを使うケースもあります。

特に高次多項式やデータ数が少ない場合は、数値不安定性が起きやすいため注意が必要です。

Excelでも十分実用的ですが、解析結果を過信せず残差や近似精度も確認することが大切です。

まとめ

Excelで多項式近似した際の係数の標準誤差は、グラフ機能ではなくLINEST関数を使うことで求められます。

多項式回帰は「x,x²,x³…を説明変数とした重回帰」であり、説明変数同士に相関があっても通常は問題ありません。

ただし高次になるほど多重共線性の影響が強くなるため、係数の解釈には注意が必要です。標準誤差を確認することで、近似式の信頼性をより深く評価できるようになります。

コメント

タイトルとURLをコピーしました