회귀 계산기이란?
Regression Calculator는 데이터 포인트에 선형, 이차, 다항식 곡선을 피팅합니다. 회귀 계수, R² 값, 표준 오차를 계산하고, 데이터와 함께 피팅 곡선을 그래프로 표시하여 시각적 분석을 지원합니다.
선형, 이차, 다항식(차수 3-10), 지수, 로그, 거듭제곱의 여섯 가지 모델을 지원합니다. 스프레드시트에서 행 단위로 바로 붙여넣을 수 있고, 파서는 쉼표, 탭, 공백을 구분자로 모두 인식합니다. 그래프에는 산점도 위에 피팅 곡선이 겹쳐 표시되고, 논문에서 인용하는 형태의 방정식이 아래에 출력됩니다.
사용 방법
- X,Y 쌍으로 데이터 포인트를 입력하거나 스프레드시트에서 붙여넣으세요.
- 회귀 유형(선형, 이차, 다항식)과 차수를 선택하세요.
- 방정식, R² 통계, 잔차 플롯을 확인하고 결과를 다운로드하세요.
사용 시기
- 과학 과제 데이터가 선형과 이차 중 어느 쪽에 더 잘 맞는지 확인할 때.
- 물리 실험 데이터에서 거듭제곱 법칙의 지수를 추정할 때.
- 비즈니스 보고서에 숫자를 옮기기 전에 추세선이 그럴듯한지 눈으로 확인할 때.
결과
연구원이 온도-수율 데이터 20개를 입력하고 이차 회귀를 선택하면 y = −0.03x² + 4.2x − 12.5, R² = 0.94라는 결과가 나와 비선형 관계를 확인합니다.
자주 묻는 질문
- R² 값은 실제로 무엇을 의미하나요?
- R²은 모델이 Y의 변동을 얼마나 설명하는지 나타내는 비율입니다. R² = 0.94라면 Y의 흔들림 중 94%가 X로 설명되고, 남은 6%는 잡음 또는 다른 요인입니다. 1에 가까우면 좋아 보이지만, 다항식에서 R²이 높으면 과적합 신호일 수 있습니다.
- 선형 대신 다항 회귀를 쓰는 게 좋은 경우는?
- 산점도에 분명한 곡률이 보이고, 물리적인 이유까지 있는 경우에만 권합니다. 차수가 높아질수록 R²은 자동으로 올라가지만, 곡선이 데이터 사이를 따라 일반화되지 않는 방식으로 흔들립니다. 차수 2부터 시작하고, 4 이상은 거의 쓰지 않습니다.
- 지수 회귀와 거듭제곱 회귀의 차이는?
- 지수형은 y = a·e^(bx)로, X가 늘 때 Y가 일정한 비율로 증가합니다(세균 번식, 복리). 거듭제곱은 y = a·x^b로, Y가 X의 상수 지수에 비례합니다(공전 주기, 생물 상대성장). 선형축에서는 비슷해 보여도 로그축에서는 분명히 갈라집니다.
- X에 0이나 음수가 있을 때도 로그 회귀가 가능한가요?
- 불가능합니다. 로그 회귀는 y = a + b·ln(x)를 피팅하는데, ln(x)는 x = 0과 음수에서 정의되지 않습니다. 데이터를 평행이동시켜 X가 모두 양수가 되게 하거나, 선형/이차로 바꾸세요. 그렇지 않으면 계산기가 오류를 반환합니다.
- 신뢰할 만한 피팅에는 데이터 포인트가 몇 개 필요하나요?
- 두 점은 직선을 완벽히 통과시키지만 흩어짐 정보는 전혀 주지 않습니다. 선형은 최소 8-10개, 차수가 높을수록 더 많이 필요합니다. 경험적으로 계수 1개당 10점이 좋은 기준입니다. 데이터가 적으면 R²이 모델 품질을 과대평가합니다.