Triển khai mô hình

Khi triển khai một mô hình, hãy bắt đầu đơn giản. Hầu hết công việc trong ML đều ở phía dữ liệu, vì vậy, việc chạy một quy trình đầy đủ cho một mô hình phức tạp sẽ khó hơn so với việc lặp lại chính mô hình đó. Sau khi thiết lập quy trình dữ liệu và triển khai một mô hình đơn giản sử dụng một vài tính năng, bạn có thể lặp lại để tạo một mô hình tốt hơn.

Các mô hình đơn giản cung cấp một đường cơ sở tốt, ngay cả khi bạn không ra mắt các mô hình đó. Trên thực tế, việc sử dụng một mô hình đơn giản có thể tốt hơn bạn nghĩ. Việc bắt đầu đơn giản giúp bạn xác định xem có nên sử dụng mô hình phức tạp hay không.

Huấn luyện mô hình của riêng bạn so với sử dụng mô hình đã được huấn luyện

Các mô hình đã huấn luyện tồn tại cho nhiều trường hợp sử dụng và mang lại nhiều ưu điểm. Tuy nhiên, các mô hình đã huấn luyện chỉ thực sự hoạt động khi nhãn và các tính năng khớp chính xác với tập dữ liệu của bạn. Ví dụ: nếu một mô hình đã huấn luyện sử dụng 25 đặc điểm và tập dữ liệu của bạn chỉ bao gồm 24 đặc điểm trong số đó, thì rất có thể mô hình đã huấn luyện sẽ đưa ra dự đoán không chính xác.

Thông thường, các nhà thực hành ML sử dụng các tiểu mục đầu vào phù hợp từ một mô hình đã huấn luyện để tinh chỉnh hoặc chuyển đổi quá trình học. Nếu không có mô hình đã huấn luyện cho trường hợp sử dụng cụ thể của bạn, hãy cân nhắc sử dụng các tiểu mục từ mô hình đã huấn luyện khi huấn luyện mô hình của riêng bạn.

Để biết thông tin về các mô hình đã huấn luyện, hãy xem

Giám sát

Trong quá trình định hình vấn đề, hãy cân nhắc cơ sở hạ tầng giám sát và cảnh báo mà giải pháp học máy của bạn cần.

Triển khai mô hình

Trong một số trường hợp, mô hình mới được huấn luyện có thể hoạt động kém hơn mô hình hiện đang hoạt động. Nếu có, bạn sẽ muốn ngăn không cho bản phát hành đó được phát hành công khai và nhận được cảnh báo cho biết quá trình triển khai tự động của bạn không thành công.

Độ lệch trong quá trình phân phát dữ liệu huấn luyện

Nếu bất kỳ đặc điểm nào sắp tới được dùng để suy luận có giá trị nằm ngoài phạm vi phân phối của dữ liệu dùng trong quá trình huấn luyện, bạn sẽ muốn được cảnh báo vì có thể mô hình sẽ đưa ra dự đoán không chính xác. Ví dụ: nếu mô hình của bạn được huấn luyện để dự đoán nhiệt độ cho các thành phố ở vùng xích đạo ở mực nước biển, thì hệ thống phân phát sẽ cảnh báo bạn về dữ liệu đến có vĩ độ và kinh độ và/hoặc độ cao nằm ngoài phạm vi mà mô hình được huấn luyện. Ngược lại, hệ thống phân phát sẽ cảnh báo bạn nếu mô hình đang đưa ra dự đoán nằm ngoài phạm vi phân phối đã thấy trong quá trình huấn luyện.

Máy chủ suy luận

Nếu đang cung cấp thông tin suy luận thông qua hệ thống RPC, bạn nên theo dõi chính máy chủ RPC và nhận cảnh báo nếu máy chủ này ngừng cung cấp thông tin suy luận.