Tính năng giao nhau được tạo bằng cách giao nhau (lấy tích Descartes của) hai hoặc nhiều tính năng phân loại hoặc nhóm của tập dữ liệu. Giống như biến đổi đa thức, phép lai ghép tính năng cho phép mô hình tuyến tính xử lý các tính năng phi tuyến tính. Các điểm giao nhau của đối tượng cũng mã hoá các hoạt động tương tác giữa các đối tượng.
Ví dụ: hãy xem xét một tập dữ liệu lá có các đặc điểm phân loại:
edges
, chứa các giá trịsmooth
,toothed
vàlobed
arrangement
, chứa các giá trịopposite
vàalternate
Giả sử thứ tự ở trên là thứ tự của các cột đặc điểm trong một đại diện một nóng, để một lá có các cạnh smooth
và sắp xếp opposite
được biểu thị là {(1, 0, 0), (1, 0)}
.
Tích chéo hoặc tích Descartes của hai tính năng này sẽ là:
{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate,
Lobed_Opposite, Lobed_Alternate}
trong đó giá trị của mỗi thuật ngữ là tích của các giá trị đặc điểm cơ sở, chẳng hạn như:
Smooth_Opposite = edges[0] * arrangement[0]
Smooth_Alternate = edges[0] * arrangement[1]
Toothed_Opposite = edges[1] * arrangement[0]
Toothed_Alternate = edges[1] * arrangement[1]
Lobed_Opposite = edges[2] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]
Ví dụ: nếu một chiếc lá có cạnh lobed
và một cách sắp xếp alternate
, thì vectơ giao nhau của đặc điểm sẽ có giá trị là 1 cho Lobed_Alternate
và giá trị là 0 cho tất cả các thuật ngữ khác:
{0, 0, 0, 0, 0, 1}
Bạn có thể dùng tập dữ liệu này để phân loại lá theo loài cây, vì các đặc điểm này không thay đổi trong một loài.
Trường hợp nên sử dụng tính năng giao nhau của tính năng
Kiến thức chuyên môn có thể đề xuất một tổ hợp hữu ích các tính năng để kết hợp. Nếu không có kiến thức chuyên môn đó, bạn có thể khó xác định các phép biến đổi đa thức hoặc phép giao tính năng hiệu quả theo cách thủ công. Thông thường, nếu chi phí tính toán cao, bạn có thể sử dụng mạng nơron để tự động tìm và áp dụng các tổ hợp tính năng hữu ích trong quá trình huấn luyện.
Hãy cẩn thận – việc giao nhau giữa hai đặc điểm thưa thớt sẽ tạo ra một đặc điểm mới thưa thớt hơn cả hai đặc điểm ban đầu. Ví dụ: nếu đặc điểm A là một đặc điểm thưa thớt gồm 100 phần tử và đặc điểm B là một đặc điểm thưa thớt gồm 200 phần tử, thì phép lai đặc điểm của A và B sẽ tạo ra một đặc điểm thưa thớt gồm 20.000 phần tử.