Mạng nơron đầu tiên

Trong bài tập này, chúng ta sẽ huấn luyện mạng nơron nhỏ đầu tiên. Mạng nơron sẽ cung cấp cho chúng ta cách tìm hiểu các mô hình phi tuyến tính mà không cần việc sử dụng nhiều tính năng rõ ràng.

Nhiệm vụ 1: Mô hình như trên kết hợp hai tính năng đầu vào thành một nơron đơn nhân. Mô hình này có học được bất kỳ hành vi phi tuyến tính nào không? Hãy chạy mã này để xác nhận đoán.

Nhiệm vụ 2: Thử tăng số lượng nơron trong lớp ẩn từ 1 sang 2, đồng thời thử thay đổi từ kích hoạt Tuyến tính sang kích hoạt phi tuyến tính như ReLU. Bạn có thể tạo một mô hình có thể tìm hiểu các phi tuyến tính không? Mô hình có thể dữ liệu một cách hiệu quả?

Nhiệm vụ 3: Thử tăng số lượng nơron trong lớp ẩn từ 2 đến 3, sử dụng kích hoạt phi tuyến tính như ReLU. Công cụ này có thể lập mô hình dữ liệu không một cách hiệu quả? Chất lượng mô hình khác nhau như thế nào giữa các lần chạy?

Nhiệm vụ 4: Tiếp tục thử nghiệm bằng cách thêm hoặc xóa các lớp ẩn và nơron trên mỗi lớp. Bạn cũng có thể thay đổi tốc độ học tập, điều chỉnh tần suất cũng như các chế độ học khác. Quảng cáo nhỏ nhất là gì số lượng nơron và lớp bạn có thể sử dụng để gây ra tổn thất kiểm thử từ 0,177 trở xuống?

Việc tăng kích thước mô hình có cải thiện sự phù hợp hay tốc độ hội tụ của mô hình không? Sự thay đổi này có thay đổi tần suất chuyển đổi thành một mô hình tốt không? Ví dụ: hãy thử cấu trúc sau:

  • Lớp ẩn đầu tiên có 3 nơron.
  • Lớp ẩn thứ hai có 3 nơron.
  • Lớp ẩn thứ ba có 2 nơron.

(Câu trả lời sẽ xuất hiện ngay bên dưới bài tập).