Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Tốc độ học tập và sự hội tụ
Đây là bài tập đầu tiên trong số một số bài tập trên Playground.
Playground là một chương trình
được phát triển riêng cho khoá học này
để dạy các nguyên tắc của công nghệ học máy.
Mỗi bài tập trên Playground trong khoá học này đều có một sân chơi nhúng
thực thể với giá trị đặt trước.
Mỗi bài tập trong Playground sẽ tạo một tập dữ liệu. Nhãn cho thuộc tính này
có thể có hai giá trị. Bạn có thể nghĩ về hai điều đó
các giá trị có thể là spam chứ không phải spam hoặc có thể là cây khoẻ so với cây bị bệnh.
Mục tiêu của hầu hết các bài tập là điều chỉnh nhiều siêu tham số khác nhau để tạo
một mô hình phân loại thành công (tách hoặc phân biệt) một
giá trị nhãn của nhãn khác. Xin lưu ý rằng hầu hết các tập dữ liệu đều chứa
lượng nhiễu khiến hệ thống không thể phân loại thành công
mỗi ví dụ.
Nhấp vào biểu tượng dấu cộng để xem nội dung giải thích về hình ảnh mô hình.
Mỗi bài tập trên Playground cho thấy một hình ảnh trực quan về
trạng thái của mô hình. Ví dụ: dưới đây là một hình ảnh trực quan:
Xin lưu ý những điều sau về hình ảnh mô hình:
Mỗi trục biểu thị một đối tượng cụ thể. Trong trường hợp thư rác chứ không phải thư rác,
các tính năng có thể là số từ và số người nhận
.
Mỗi dấu chấm biểu thị các giá trị đối tượng cho một ví dụ về dữ liệu, chẳng hạn như
một email.
Màu của dấu chấm đại diện cho lớp chứa ví dụ này.
Ví dụ: dấu chấm màu xanh dương có thể đại diện cho các email không phải thư rác trong khi
các dấu chấm màu cam có thể biểu thị email rác.
Màu nền thể hiện thông tin dự đoán của mô hình về vị trí mà các ví dụ
của màu đó. Nền màu xanh dương xung quanh chấm màu xanh dương
có nghĩa là mô hình này dự đoán chính xác ví dụ đó. Ngược lại,
nền màu cam xung quanh chấm màu xanh dương có nghĩa là mô hình đang
dự đoán không chính xác ví dụ đó.
Nền xanh lam và cam được chia tỷ lệ. Ví dụ: phía bên trái của
hình ảnh có màu xanh dương đồng nhất nhưng mờ dần sang màu trắng ở giữa
của hình ảnh trực quan đó. Bạn có thể coi độ mạnh màu sắc là gợi ý
độ tin cậy của mô hình vào dự đoán. Màu xanh dương đồng nhất có nghĩa là mô hình
rất tự tin về dự đoán của mình và màu xanh dương nhạt có nghĩa là mô hình
thì kém tự tin hơn. (Hình ảnh trực quan về mô hình trong hình này đang hoạt động
dự đoán rất kém.)
Sử dụng hình ảnh trực quan để đánh giá tiến trình của mô hình.
("Rất tốt – hầu hết các chấm màu xanh dương có nền màu xanh dương" hoặc
"Ôi không! Các chấm màu xanh dương có nền màu cam".)
Ngoài màu sắc, Playground
còn hiển thị tổn thất hiện tại của mô hình bằng số.
("Ôi không! Tổn thất là tăng lên thay vì giảm.")
Giao diện cho bài tập này có 3 nút:
Biểu tượng
Tên
Tác dụng
Đặt lại
Đặt lại Lặp lại về 0. Đặt lại mọi trọng số mà mô hình có
đã học.
Bước
Tiến một lần lặp. Với mỗi lần lặp lại, mô hình
những thay đổi nhỏ và đôi khi rất nhỏ.
Tạo lại
Tạo tập dữ liệu mới. Không đặt lại Lượt lặp lại.
Trong bài tập Playground đầu tiên này, bạn sẽ thử nghiệm với
tốc độ học tập bằng cách thực hiện 2 nhiệm vụ.
Nhiệm vụ 1: Lưu ý trình đơn Tốc độ học ở trên cùng bên phải của
Playground. Tỷ lệ học được là 3 rất cao. Quan sát
mức độ ảnh hưởng của tỷ lệ học cao đó đến mô hình của bạn bằng cách nhấp vào "Bước"
10 hoặc 20 lần. Sau mỗi lần lặp lại đầu tiên, hãy chú ý đến cách mô hình
trực quan hoá thay đổi đáng kể. Thậm chí, bạn có thể thấy một số điểm không ổn định
sau khi mô hình dường như đã hội tụ. Đồng thời chú ý đến các dòng đang chạy
từ x1 và x2 thành hình ảnh mô hình. Trọng số của
những đường này cho biết trọng số của các đối tượng đó trong mô hình. Tức là một
đường dày cho biết trọng số cao.
Nhiệm vụ 2: Làm như sau:
Nhấn nút Reset (Đặt lại).
Giảm Tốc độ học.
Nhấn nút Bước nhiều lần.
Tốc độ học tập thấp hơn ảnh hưởng như thế nào đến sự hội tụ? Kiểm tra cả
số bước cần thiết để mô hình hội tụ cũng như mức độ suôn sẻ
và mô hình hội tụ ổn định. Thử nghiệm với các giá trị thấp hơn nữa là
tốc độ học tập. Bạn có thấy tốc độ học quá chậm nên không hữu ích không? (Bạn sẽ
tìm một thảo luận ngay bên dưới bài tập).
Nhấp vào biểu tượng dấu cộng để thảo luận về Nhiệm vụ 2.
Do tính chất không tất định của các bài tập trên Playground,
không phải lúc nào chúng tôi cũng có thể cung cấp câu trả lời hoàn toàn tương ứng với tập dữ liệu của bạn.
Tuy nhiên, tốc độ học là 0,1 cũng đã được hội tụ một cách hiệu quả.
Tốc độ học tập thấp hơn mất nhiều thời gian hơn để hội tụ; tức là nhỏ hơn
thì tốc độ học tập quá chậm nên không thể hữu ích.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2024-08-22 UTC."],[],[]]