새 가중치와 편향을 사용하여 손실을 계산하고 반복합니다. 이 프로세스를 6번 반복하면 다음 가중치, 편향, 손실이 나옵니다.
반복
무게
편향
손실 (MSE)
1
0
0
303.71
2
1.20
0.34
170.84
3
2.05
0.59
103.17
4
2.66
0.78
68.70
5
3.09
0.91
51.13
6
3.40
1.01
42.17
업데이트된 가중치와 편향이 있을 때마다 손실이 낮아지는 것을 확인할 수 있습니다.
이 예에서는 6번의 반복 후에 중지했습니다. 실제로 모델은 수렴될 때까지 학습됩니다.
모델이 수렴되면 경사하강법이 손실을 거의 최소화하는 가중치와 편향을 찾았기 때문에 추가 반복이 손실을 더 줄이지 않습니다.
모델이 수렴 후에도 계속 학습하면 모델이 최저값 주변의 매개변수를 계속 업데이트하므로 손실이 약간씩 변동하기 시작합니다. 이로 인해 모델이 실제로 수렴되었는지 확인하기 어려울 수 있습니다. 모델이 수렴되었는지 확인하려면 손실이 안정화될 때까지 학습을 계속해야 합니다.
모델 수렴 및 손실 곡선
모델을 학습할 때 손실 곡선을 살펴보고 모델이 수렴했는지 확인하는 경우가 많습니다. 손실 곡선은 모델이 학습됨에 따라 손실이 어떻게 변하는지 보여줍니다. 일반적인 손실 곡선은 다음과 같습니다. 손실은 y축에 있고 반복은 x축에 있습니다.
그림 12. 모델이 1,000번째 반복 표시 근처로 수렴하는 것을 보여주는 손실 곡선
처음 몇 번의 반복 동안 손실이 크게 감소한 다음 1,000번째 반복 지점 근처에서 평탄해지기 전에 점차 감소하는 것을 확인할 수 있습니다. 1,000번의 반복 후에는 모델이 수렴되었다고 확신할 수 있습니다.
다음 그림에서는 학습 과정의 세 지점(시작, 중간, 끝)에서 모델을 그립니다. 학습 과정에서 스냅샷의 모델 상태를 시각화하면 가중치와 편향 업데이트, 손실 감소, 모델 수렴 간의 연결이 강화됩니다.
그림에서는 특정 반복에서 파생된 가중치와 편향을 사용하여 모델을 나타냅니다. 데이터 포인트와 모델 스냅샷이 있는 그래프에서 모델에서 데이터 포인트까지의 파란색 손실 선은 손실량을 보여줍니다. 선이 길수록 손실이 많아집니다.
다음 그림에서 두 번째 반복이 지나면 손실이 많아 모델이 예측을 잘하지 못함을 알 수 있습니다.
그림 13. 학습 프로세스 시작 시의 손실 곡선과 모델 스냅샷
400번째 반복쯤에 경사 하강법이 더 나은 모델을 생성하는 가중치와 편향을 찾은 것을 확인할 수 있습니다.
그림 14. 학습 중간 지점의 손실 곡선과 모델 스냅샷
1,000번째 반복이 되면 모델이 수렴되어 손실이 가장 낮은 모델이 생성됩니다.
그림 15. 학습 프로세스 종료 시점의 손실 곡선과 모델 스냅샷
연습: 학습 내용 점검하기
선형 회귀에서 경사 하강법의 역할은 무엇인가요?
경사하강법은 손실을 최소화하는 최적의 가중치와 편향을 찾는 반복적인 프로세스입니다.
경사 하강법은 모델을 학습시킬 때 사용할 손실 유형(예: L1 또는 L2)을 결정하는 데 도움이 됩니다.
경사하강법은 모델 학습을 위한 손실 함수 선택과 관련이 없습니다.
경사 하강법은 모델이 더 나은 예측을 할 수 있도록 데이터 세트에서 이상치를 제거합니다.
경사 하강법은 데이터 세트를 변경하지 않습니다.
수렴 및 볼록 함수
선형 모델의 손실 함수는 항상 볼록 곡면을 생성합니다. 이 속성으로 인해 선형 회귀 모델이 수렴되면 모델이 손실을 가장 낮게 만드는 가중치와 편향을 찾은 것으로 간주됩니다.
특성이 하나인 모델의 손실 표면을 그래프로 나타내면 볼록한 모양을 확인할 수 있습니다. 다음은 가상의 갤런당 마일 데이터 세트의 손실 표면입니다. 가중치는 x축에, 편향은 y축에, 손실은 z축에 있습니다.
그림 16. 볼록한 모양을 보여주는 손실 곡면
이 예시에서 가중치 -5.44와 편향 35.94는 5.54에서 가장 낮은 손실을 생성합니다.
그림 17. 손실이 가장 낮은 가중치와 편향 값을 보여주는 손실 곡면
선형 모델은 최소 손실이 발견되면 수렴됩니다. 경사 하강법 중에 가중치와 편향점을 그래프로 표시하면 점이 언덕 아래로 굴러 내려가 더 이상 아래쪽 경사가 없는 지점에서 멈추는 공처럼 보입니다.
그림 18. 그래프의 최저점에서 중지되는 경사 하강법 포인트를 보여주는 손실 그래프
검은색 손실 포인트가 손실 곡선의 정확한 모양을 만듭니다. 손실 곡면의 최저점에 도달할 때까지 점진적으로 아래로 기울어지기 전에 급격히 감소합니다.
손실이 가장 낮은 가중치와 편향 값(이 경우 가중치 -5.44, 편향 35.94)을 사용하여 모델을 그래프로 표시하여 데이터에 얼마나 잘 맞는지 확인할 수 있습니다.
그림 19. 손실이 가장 적은 가중치와 편향 값을 사용하여 그래프로 표시된 모델
다른 가중치와 편향 값으로는 손실이 더 적은 모델을 생성할 수 없으므로 이 데이터 세트에는 이 모델이 가장 적합합니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2026-02-03(UTC)"],[],[]]