Hình 1. Vấn đề phân loại phi tuyến tính. Hàm tuyến tính không được
tách riêng tất cả các chấm màu xanh dương khỏi các chấm màu cam.
"Không tuyến tính" có nghĩa là bạn không thể dự đoán chính xác một nhãn bằng mô hình ở dạng \(b + w_1x_1 + w_2x_2\). Nói cách khác, "bề mặt quyết định" không phải là một đường thẳng.
Tuy nhiên, nếu thực hiện phép nhân các đặc điểm trên các đặc điểm $x_1$ và $x_2$, chúng ta có thể biểu thị mối quan hệ phi tuyến tính giữa hai đặc điểm này bằng cách sử dụng mô hình tuyến tính: $b + w_1x_1 + w_2x_2 + w_3x_3$, trong đó $x_3$ là phép nhân các đặc điểm giữa $x_1$ và $x_2$:
Hình 2. Bằng cách thêm giao điểm của các đặc điểm x1x2, mô hình tuyến tính có thể học được một hình dạng hyperbolic phân tách các dấu chấm màu xanh dương với các dấu chấm màu cam.
Bây giờ, hãy xem xét tập dữ liệu sau:
Hình 3. Một vấn đề khó phân loại phi tuyến tính hơn.
Bạn cũng có thể nhớ lại từ Bài tập về phép lai ghép tính năng rằng việc xác định đúng phép lai ghép tính năng để phù hợp với mô hình tuyến tính cho dữ liệu này cần nhiều nỗ lực và thử nghiệm hơn một chút.
Nhưng nếu bạn không phải tự mình thực hiện tất cả các thử nghiệm đó thì sao?
Mạng nơron là một gia đình
cấu trúc mô hình được thiết kế để tìm
nonlinear
trong dữ liệu. Trong quá trình huấn luyện mạng nơron, mô hình sẽ tự động học các giao điểm đặc điểm tối ưu để thực hiện trên dữ liệu đầu vào nhằm giảm thiểu tổn thất.
Trong các phần sau, chúng ta sẽ xem xét kỹ hơn về cách hoạt động của mạng nơron.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2025-07-27 UTC."],[[["This module explores neural networks, a model architecture designed to automatically identify nonlinear patterns in data, eliminating the need for manual feature cross experimentation."],["You will learn the fundamental components of a deep neural network, including nodes, hidden layers, and activation functions, and how they contribute to prediction."],["The module covers the training process of neural networks, using the backpropagation algorithm to optimize predictions and minimize loss."],["Additionally, you will gain insights into how neural networks handle multi-class classification problems using one-vs.-all and one-vs.-one approaches."],["This module builds on prior knowledge of machine learning concepts such as linear and logistic regression, classification, and working with numerical and categorical data."]]],[]]