회귀 계산기이란?

Regression Calculator는 데이터 포인트에 선형, 이차, 다항식 곡선을 피팅합니다. 회귀 계수, R² 값, 표준 오차를 계산하고, 데이터와 함께 피팅 곡선을 그래프로 표시하여 시각적 분석을 지원합니다.

선형, 이차, 다항식(차수 3-10), 지수, 로그, 거듭제곱의 여섯 가지 모델을 지원합니다. 스프레드시트에서 행 단위로 바로 붙여넣을 수 있고, 파서는 쉼표, 탭, 공백을 구분자로 모두 인식합니다. 그래프에는 산점도 위에 피팅 곡선이 겹쳐 표시되고, 논문에서 인용하는 형태의 방정식이 아래에 출력됩니다.

사용 방법

  1. X,Y 쌍으로 데이터 포인트를 입력하거나 스프레드시트에서 붙여넣으세요.
  2. 회귀 유형(선형, 이차, 다항식)과 차수를 선택하세요.
  3. 방정식, R² 통계, 잔차 플롯을 확인하고 결과를 다운로드하세요.

사용 시기

  • 과학 과제 데이터가 선형과 이차 중 어느 쪽에 더 잘 맞는지 확인할 때.
  • 물리 실험 데이터에서 거듭제곱 법칙의 지수를 추정할 때.
  • 비즈니스 보고서에 숫자를 옮기기 전에 추세선이 그럴듯한지 눈으로 확인할 때.

결과

연구원이 온도-수율 데이터 20개를 입력하고 이차 회귀를 선택하면 y = −0.03x² + 4.2x − 12.5, R² = 0.94라는 결과가 나와 비선형 관계를 확인합니다.

자주 묻는 질문

R² 값은 실제로 무엇을 의미하나요?
R²은 모델이 Y의 변동을 얼마나 설명하는지 나타내는 비율입니다. R² = 0.94라면 Y의 흔들림 중 94%가 X로 설명되고, 남은 6%는 잡음 또는 다른 요인입니다. 1에 가까우면 좋아 보이지만, 다항식에서 R²이 높으면 과적합 신호일 수 있습니다.
선형 대신 다항 회귀를 쓰는 게 좋은 경우는?
산점도에 분명한 곡률이 보이고, 물리적인 이유까지 있는 경우에만 권합니다. 차수가 높아질수록 R²은 자동으로 올라가지만, 곡선이 데이터 사이를 따라 일반화되지 않는 방식으로 흔들립니다. 차수 2부터 시작하고, 4 이상은 거의 쓰지 않습니다.
지수 회귀와 거듭제곱 회귀의 차이는?
지수형은 y = a·e^(bx)로, X가 늘 때 Y가 일정한 비율로 증가합니다(세균 번식, 복리). 거듭제곱은 y = a·x^b로, Y가 X의 상수 지수에 비례합니다(공전 주기, 생물 상대성장). 선형축에서는 비슷해 보여도 로그축에서는 분명히 갈라집니다.
X에 0이나 음수가 있을 때도 로그 회귀가 가능한가요?
불가능합니다. 로그 회귀는 y = a + b·ln(x)를 피팅하는데, ln(x)는 x = 0과 음수에서 정의되지 않습니다. 데이터를 평행이동시켜 X가 모두 양수가 되게 하거나, 선형/이차로 바꾸세요. 그렇지 않으면 계산기가 오류를 반환합니다.
신뢰할 만한 피팅에는 데이터 포인트가 몇 개 필요하나요?
두 점은 직선을 완벽히 통과시키지만 흩어짐 정보는 전혀 주지 않습니다. 선형은 최소 8-10개, 차수가 높을수록 더 많이 필요합니다. 경험적으로 계수 1개당 10점이 좋은 기준입니다. 데이터가 적으면 R²이 모델 품질을 과대평가합니다.

관련 도구