Tổng quan về quy trình máy học

Xin chúc mừng! Mô hình của bạn đã sẵn sàng để triển khai cho quy trình công nghệ máy học. Phần này của khóa học giới thiệu các nguyên tắc kiểm thử cho quy trình máy học. Tuy nhiên, phần này không minh hoạ các nguyên tắc này vì không thể minh hoạ như vậy trong môi trường hộp cát.

Bạn sẽ tìm hiểu về:

  • Viết kiểm thử thích hợp để phát hành và sản xuất.
  • Phát hiện các chế độ không thành công trong quy trình máy học bằng cách sử dụng các chương trình kiểm thử.
  • Đánh giá chất lượng mô hình của bạn trong sản xuất.

Quy trình công nghệ máy học là gì?

Một quy trình máy học bao gồm một số thành phần, như minh họa trên sơ đồ. Chúng ta sẽ làm quen với các thành phần này sau. Hiện tại, hãy lưu ý rằng “Model” (hộp màu đen) là một phần nhỏ của cơ sở hạ tầng quy trình cần thiết cho hoạt động máy học.

Sơ đồ quy trình máy học thông thường. Sơ đồ cho thấy một số hộp, mỗi hộp cho một thành phần của quy trình. "Hộp" mô hình được gắn nhãn ở giữa sơ đồ. Các hộp khác được sắp xếp xung quanh hộp "model". Các hộp này được gắn nhãn: thu thập dữ liệu, xác minh dữ liệu, quản lý tài nguyên máy, cơ sở hạ tầng phân phát, trích xuất tính năng, công cụ phân tích, công cụ quản lý quy trình, cấu hình và giám sát.
Hình 1: Sơ đồ quy trình máy học thông thường.

Vai trò của hoạt động kiểm thử trong quy trình máy học

Trong quá trình phát triển phần mềm, quy trình làm việc lý tưởng tuân theo quá trình phát triển dựa trên kiểm thử (TDD). Tuy nhiên, ở máy học, việc bắt đầu bằng thử nghiệm không hề đơn giản. Các chương trình kiểm thử phụ thuộc vào dữ liệu, mô hình và vấn đề. Ví dụ: trước khi đào tạo mô hình, bạn không thể viết kiểm thử để xác thực tổn thất. Thay vào đó, bạn sẽ khám phá tổn thất có thể đạt được trong quá trình phát triển mô hình, sau đó kiểm thử các phiên bản mô hình mới để tránh tổn thất có thể đạt được.

Bạn cần phải kiểm tra để:

  • Xác thực dữ liệu đầu vào.
  • Xác thực kỹ thuật tính năng.
  • Đang xác thực chất lượng của các phiên bản mô hình mới.
  • Đang xác thực cơ sở hạ tầng phân phối.
  • Kiểm thử quá trình tích hợp giữa các thành phần của quy trình.