Tổng quát hoá

Tổng quát đề cập đến khả năng mô hình của bạn thích ứng đúng cách với dữ liệu mới, chưa từng thấy trước đây, được lấy từ cùng một kiểu phân phối như dữ liệu được dùng để tạo mô hình.

Tổng quát hoá

Chu kỳ mô hình, dự đoán, mẫu, khám phá sự phân phối thực sự, nhiều mẫu hơn
  • Mục tiêu: dự đoán hiệu quả dựa trên dữ liệu mới được phân phối từ dữ liệu phân phối thực (ẩn).
  • Vấn đề: chúng tôi không thấy sự thật.
    • Chúng tôi chỉ lấy mẫu từ thư viện này.
Chu kỳ mô hình, dự đoán, mẫu, khám phá sự phân phối thực sự, nhiều mẫu hơn
  • Mục tiêu: dự đoán hiệu quả dựa trên dữ liệu mới được phân phối từ dữ liệu phân phối thực (ẩn).
  • Vấn đề: chúng tôi không thấy sự thật.
    • Chúng tôi chỉ lấy mẫu từ thư viện này.
  • Nếu mô hình h phù hợp với mẫu hiện tại của chúng tôi, làm cách nào chúng tôi tin tưởng mô hình h sẽ dự đoán tốt các mẫu mới khác?
  • Về mặt lý thuyết:
    • Lĩnh vực thú vị: lý thuyết tổng quát
    • Dựa trên ý tưởng về việc đo lường mức độ đơn giản / độ phức tạp của mô hình.
  • Trực quan: chính thức hoá nguyên tắc Dao cạo
    • Mô hình càng phức tạp, càng có nhiều khả năng kết quả thực nghiệm tốt không chỉ do đặc điểm của mẫu của chúng tôi.
  • Theo kinh nghiệm:
    • Hỏi: liệu mô hình của chúng ta có hoạt động tốt trên một mẫu dữ liệu mới không?
    • Đánh giá: lấy mẫu lệnh gọi dữ liệu mới cho nhóm thử nghiệm
    • Hiệu suất tốt trên nhóm thử nghiệm là một chỉ báo hữu ích về hiệu suất tốt của dữ liệu mới nói chung:
      • Nếu bộ kiểm thử đủ lớn
      • Nếu chúng ta không gian lận bằng cách sử dụng nhiều lần kiểm thử

Ba giả định cơ bản trong tất cả các trường hợp trên:

  1. Chúng tôi vẽ ngẫu nhiên các ví dụ độc lập và giống hệt nhau (tức là) từ việc phân phối
  2. Hoạt động phân bổ này cố định: Không thay đổi theo thời gian
  3. Chúng tôi luôn lấy từ cùng một kênh phân phối: Bao gồm đào tạo, xác thực và bộ thử nghiệm