Day 1: Regression — 예측의 예술
Source: Dev.to
회귀란 무엇인가?
회귀는:
과거 정보를 사용해 미래의 숫자를 예측하는 것.
예시
| 질문 | 유형 |
|---|---|
| 집값 예측 | 회귀 |
| 급여 예측 | 회귀 |
| 온도 예측 | 회귀 |
| 합격/불합격 예측 | ❌ 회귀 아님 |
👉 출력이 숫자이면 → 회귀.
왜 회귀가 필요할까?
인간:
- 대충 추측한다
- 패턴을 잊어버린다
- 편향될 수 있다
기계:
- 모든 데이터를 기억한다
- 패턴을 명확히 본다
- 일관된 예측을 제공한다
그래서 기계가 과거 데이터를 학습하도록 하고 우리를 대신해 예측하게 한다.
입력 & 출력
회귀를 주스 머신에 비유해 보자.
| 부분 | 머신러닝 용어 |
|---|---|
| 넣는 과일 | 입력 / 특징 |
| 얻는 주스 | 출력 / 타깃 |
예시
- 입력: 집 크기, 방 개수, 위치
- 출력: 집 가격
회귀는 “입력이 이렇게 생겼다면 → 출력은 보통 이렇게 된다”는 것을 학습한다.
회귀 vs 분류
| 회귀 | 분류 |
|---|---|
| 숫자를 예측 | 라벨을 예측 |
| 급여 = ₹50,000 | 스팸 / 스팸 아님 |
| 집값 | 예 / 아니오 |
| 온도 | 합격 / 불합격 |
📌 면접 규칙: 출력이 연속형이면 → 회귀.
실제 활용 사례
| 분야 | 회귀 활용 예시 |
|---|---|
| 금융 | 대출 금액 예측 |
| 의료 | 회복 시간 |
| 부동산 | 주택 가격 |
| 전자상거래 | 수요 예측 |
| 날씨 | 강수량 |
회귀는 어디에나 존재하며 조용히 작동한다.
지도학습
아이에게 수학을 가르친다고 생각해 보자. 선생님은:
- 문제를 보여준다
- 정답을 보여준다
- 틀린 부분을 고쳐준다
아이: “이런 문제가 나오면 보통 이런 답이 맞다.”
이것이 지도학습이다.
회귀에 적용하기
회귀에서는 기계가 아이가 된다.
- 입력: 집 크기, 방 개수, 위치
- 정답 출력: 실제 집 가격
모델은 “이 입력들이 함께 나타날 때, 가격은 이다”라고 학습한다.
정답을 이미 알고 있기 때문에 맹목적으로 추측하지 않는다; 우리는 정답을 제공하고 학습을 감독한다.
기억할 간단한 규칙: 데이터에 정답이 이미 있다면 → 지도학습.
작은 실제 비유
| 상황 | 학습 유형 |
|---|---|
| 선생님이 숙제를 채점함 | 지도학습 |
| 아이가 스스로 시행착오를 겪음 | 비지도학습 |
회귀 = 선생님이 숙제를 채점하는 것.
회귀는 라벨이 달린 데이터(정답이 알려진 데이터)에서 학습하기 때문에 지도학습 알고리즘이다.
간단한 직관 연습
휴대폰 가격을 생각해 보자.
- 입력: RAM, 저장 용량, 브랜드
- 출력: 가격
우리 뇌도 이미 회귀를 수행한다. 머신러닝은 이를 더 빠르고 정확하게 해준다.
3줄 요약 (꼭 기억하자)
- 회귀는 라벨이 아닌 숫자를 예측한다.
- 과거 데이터에서 패턴을 학습한다.
- 일상 생활에서도 이미 회귀를 사용하고 있다.
다음에 다룰 내용
이제 회귀가 무엇인지 알았으니, 다음 질문은:
“기계는 어떻게 최적의 예측을 학습할까?”
그 답은 선형 회귀에 있다.
👉 Day 2: How a Straight Line Learns From Data