Bài tập 1: Bắt đầu rõ ràng và đơn giản

Viết những gì bạn muốn mô hình máy học thực hiện.

Chúng tôi muốn mô hình máy học này:

Mẹo để có Thành Công
Tại thời điểm này, câu lệnh có thể là định tính, nhưng đảm bảo rằng câu lệnh này thể hiện được mục tiêu thực của bạn chứ không phải mục tiêu gián tiếp. Nếu bạn không chắc chắn, hãy xem các bài học trước và xem mô hình máy học nào có thể làm được.

Bài tập 2: Kết quả lý tưởng của bạn

Việc thêm mô hình máy học vào hệ thống sẽ tạo ra kết quả mong muốn. Kết quả này độc lập với mô hình nào? Xin lưu ý rằng kết quả này có thể khá khác với cách bạn đánh giá mô hình và chất lượng mô hình.

Kết quả lý tưởng của chúng ta là:

Mẹo để có Thành Công
Bạn không cần phải tự giới hạn các chỉ số mà sản phẩm của bạn đang được tối ưu hoá (các chỉ số này sẽ được đề cập trong bài tập tiếp theo). Thay vào đó, hãy cố gắng tập trung vào mục tiêu lớn hơn của sản phẩm hoặc dịch vụ.

Bài tập 3: Chỉ số thành công

Viết ra các chỉ số về sự thành công và thất bại bằng hệ thống máy học. Các chỉ số về lỗi rất quan trọng, tức là làm thế nào để bạn biết được liệu hệ thống máy học có gặp lỗi không. Cả chỉ số thành công và không thành công đều phải được diễn đạt độc lập với chỉ số đánh giá cho mô hình. Ví dụ: không nói về độ chính xác, mức độ ghi nhớ hoặc AUC; thay vào đó, hãy nói về kết quả dự kiến. Thông thường, các chỉ số này sẽ gắn với kết quả lý tưởng mà bạn đã chỉ định ở trên.

Các chỉ số thành công của chúng tôi là:

Mô hình máy học của chúng tôi sẽ bị coi là không thành công nếu:

Mẹo để có Thành Công
  • Các chỉ số này có đo lường được không?
  • Bạn sẽ đo lường các chỉ số này như thế nào?
  • Khi nào bạn có thể đo lường chúng?
    • Bạn sẽ mất bao lâu để biết được liệu hệ thống máy học mới của bạn sẽ thành công hay thất bại?
  • Hãy cân nhắc chi phí kỹ thuật và bảo trì trong thời gian dài.
  • Thất bại không chỉ do không đạt được chỉ số thành công.

Bài tập 4: Đầu ra của bạn

Ghi dữ liệu đầu ra mà bạn muốn tạo mô hình máy học.

Kết quả từ mô hình máy học của chúng tôi sẽ là:

Kết quả đầu ra được định nghĩa như sau:

Mẹo để có Thành Công
  • Kết quả phải có thể định lượng được bằng định nghĩa mà máy có thể tạo ra.
  • Nếu dùng công nghệ máy học dự đoán, bạn có thể lấy dữ liệu đầu ra mẫu để dùng cho dữ liệu huấn luyện không?
    • Cách thức và nguồn thông tin?
  • Bạn có thể cần thiết kế các ví dụ đầu ra, chẳng hạn như biến thời gian xem thành phân vị.
  • Nếu gặp khó khăn trong việc lấy kết quả mẫu để dùng cho việc đào tạo, bạn có thể cần truy cập lại các câu trả lời của mình cho bài tập trước để điều chỉnh vấn đề và mục tiêu của bạn thành những bài tập cho phép bạn đào tạo một mô hình dựa trên dữ liệu của bạn.

Bài tập 5: Sử dụng kết quả đầu ra

Ghi dữ liệu về thời điểm phải lấy kết quả từ mô hình máy học và cách sử dụng kết quả đó trong sản phẩm của bạn.

Kết quả từ mô hình máy học sẽ nhận được khi:

Kết quả sẽ được sử dụng cho:

Mẹo để có Thành Công
Xem xét những dữ liệu bạn cần để đưa ra dự đoán. Ví dụ: nếu bạn đang sử dụng công nghệ máy học để dự đoán thời gian di chuyển trong một ứng dụng bản đồ, thì điều này có thể được viết là "Kết quả từ mô hình sẽ nhận được khi người dùng chọn điểm xuất phát, điểm đến và phương thức di chuyển."
Cân nhắc cách bạn sẽ sử dụng kết quả dự đoán trong sản phẩm của mình.
  • Nội dung này có hiển thị ngay cho người dùng trong giao diện người dùng không?
  • Nó có được sử dụng bởi logic kinh doanh tiếp theo không?
  • Bạn có những yêu cầu về độ trễ nào?
Những yêu cầu đó (yêu cầu phân phát của mô hình máy học) có thể ảnh hưởng đến thông tin có thể dùng để đưa ra thông tin dự đoán. Ví dụ:
  • Độ trễ của việc sử dụng dữ liệu từ các dịch vụ từ xa có thể khiến chúng không sử dụng được.
  • Nếu các nguồn dữ liệu bị trễ khi cung cấp thông tin mới:
    • Nhật ký đã xử lý chỉ có thể được tạo một lần mỗi ngày.
    • Một số thông tin nhất định sẽ không được biết cho đến khi nó thực sự xảy ra (chẳng hạn như các sự kiện chuyển đổi).
Bài kiểm tra Oracle: giả sử bạn luôn có câu trả lời đúng. Bạn sẽ sử dụng lựa chọn đó như thế nào trong sản phẩm của mình?

Bài tập 6: Khả năng dự phòng của bạn

Hãy viết cách bạn sẽ giải quyết vấn đề nếu không dùng máy học. Ví dụ: những thông tin phỏng đoán mà bạn có thể sử dụng.

Nếu không sử dụng công nghệ máy học, chúng tôi sẽ:

Mẹo để có Thành Công
Hãy nghĩ đến tình huống bạn cần giao sản phẩm cho ngày mai và bạn chỉ có thể mã hoá logic kinh doanh. Bạn sẽ làm gì?
Nhấp vào nút bên dưới để in hoặc lưu câu trả lời của bạn dưới dạng .pdf.

In Trang