제1신경망

이 연습에서는 첫 번째 작은 신경망을 학습시켜 보겠습니다. 신경망은 신경망을 사용하지 않고 비선형 모델을 명시적 특성 교차를 사용하는 것이 좋습니다

작업 1: 주어진 모델은 두 개의 입력 특성을 결합하여 단일 뉴런으로 구성됩니다. 이 모델이 비선형성을 학습할 수 있을까요? 실행하여 알 수 있습니다.

작업 2: 히든 레이어의 뉴런 수를 선형 활성화에서 비선형 활성화로 변경해 보세요. ReLU와 같은 기능을 예로 들 수 있습니다 비선형성을 학습할 수 있는 모델을 만들 수 있을까요? 모델링할 수 있나요? 어떻게 알 수 있을까요?

작업 3: 히든 레이어의 뉴런 수를 ReLU와 같은 비선형 활성화를 사용하여 데이터를 모델링할 수 있는가 어떻게 알 수 있을까요? 실행마다 모델 품질이 어떻게 다른가요?

작업 4: 히든 레이어를 추가하거나 삭제하여 실험 계속하기 레이어당 뉴런 수가 포함됩니다 또한 학습률은 자유롭게 정규화 등이 있습니다. 가장 작은 테스트 손실을 구하기 위해 사용할 수 있는 뉴런과 레이어의 수 0.177 이하인가요?

모델 크기를 늘리면 적합성이 개선되나요, 아니면 수렴이 얼마나 빠르게 되나요? 이로 인해 좋은 모델로 수렴되는 빈도가 변경되나요? 예를 들어 확인할 수 있습니다

  • 뉴런 3개가 있는 첫 번째 히든 레이어입니다.
  • 뉴런이 3개 있는 두 번째 히든 레이어.
  • 뉴런 2개가 있는 세 번째 히든 레이어입니다.

(정답은 실습 바로 아래에 표시됩니다.)