回帰計算ツールとは?
回帰分析計算ツールは、データポイントに線形、二次、多項式の曲線をフィットさせます。係数、R²値、標準誤差を計算し、フィットした曲線をデータと一緒にグラフ上にプロットして視覚的に分析できます。
線形・二次・多項式(次数 3-10)・指数・対数・累乗の 6 種類のモデルが選べます。スプレッドシートから行ごとに貼り付けることができ、パーサーはカンマ・タブ・空白のいずれの区切りも受け付けます。グラフは散布図にフィット曲線を重ね、論文で使われる形の方程式を下に表示します。
使い方
- X,Yペアでデータポイントを入力するか、スプレッドシートから貼り付けます。
- 回帰の種類(線形、二次、多項式)と次数を選択します。
- 方程式、R²統計量、残差プロットを確認し、結果をダウンロードします。
使用するタイミング
- 自由研究のデータが線形と二次のどちらに合うかを確認したいとき。
- 物理実験の測定値から、べき乗則の指数を見積もりたいとき。
- ビジネスレポートに数字を貼る前に、トレンドラインを目視で確認したいとき。
結果
研究者が温度と収量の20個のデータポイントを入力し、二次回帰を選択すると、y = -0.03x² + 4.2x - 12.5(R² = 0.94)が得られ、非線形関係が確認されます。
よくある質問
- R² の値は実際には何を意味していますか?
- R² は Y のばらつきのうちモデルで説明できる割合です。R² = 0.94 なら Y の上下動の 94% を X が説明できており、残り 6% はノイズや他の要因です。1 に近いほど見栄えは良いですが、多項式回帰では過学習のサインでもあります。
- 線形ではなく多項式回帰を使うのはどんなときですか?
- 散布図に明確な曲がりがあり、かつ物理的な理由がある場合に限ります。高次項を入れると R² は機械的に上がりますが、データ点の間で曲線が暴れます。まず次数 2 から始め、4 を超えることはほとんどありません。
- 指数回帰と累乗回帰はどう違いますか?
- 指数は y = a·e^(bx) で、X の増加に対して Y が一定割合で増える(細菌、複利)。累乗は y = a·x^b で、Y が X の定数乗に比例します(惑星の公転周期、生物のアロメトリ)。線形軸では似て見えますが、対数軸ではっきり違いが出ます。
- X に 0 や負数が含まれるときも対数回帰はできますか?
- できません。対数回帰は y = a + b·ln(x) を当てはめますが、ln(x) は x = 0 や負数では定義されません。データ全体を平行移動して X を正にするか、線形・二次を選んでください。そのままだとツールはエラーを返します。
- 信頼できるフィットには何点くらい必要ですか?
- 2 点なら直線は完全に通りますが、ばらつきは何も分かりません。線形なら最低 8-10 点、次数が高くなるほど多く必要です。経験則として、推定する係数 1 つあたり 10 点。点数が少ないと R² がモデルの良さを過大評価します。