Рисунок 1. Задача нелинейной классификации. Линейная функция не может четко отделить все синие точки от оранжевых.
«Нелинейный» означает, что вы не можете точно предсказать этикетку с помощью модели формы. \(b + w_1x_1 + w_2x_2\). Другими словами, «поверхность принятия решений» — это не линия.
Однако, если мы выполним перекрестное преобразование наших объектов $x_1$ и $x_2$, мы сможем представить нелинейную связь между двумя объектами, используя линейную модель : $b + w_1x_1 + w_2x_2 + w_3x_3$, где $x_3$ — это функция, пересекающаяся между $x_1$ и $x_2$:
Рисунок 2. Добавляя перекрестие признаков x1x2 , линейная модель может изучить гиперболическую форму, которая отделяет синие точки от оранжевых точек.
Теперь рассмотрим следующий набор данных:
Рисунок 3. Более сложная задача нелинейной классификации.
Вы также можете вспомнить из упражнений по скрещиванию признаков , что определение правильных скрещиваний признаков для соответствия линейной модели этим данным потребовало немного больше усилий и экспериментов.
Но что, если бы вам не пришлось проводить все эти эксперименты самостоятельно? Нейронные сети — это семейство модельных архитектур, предназначенных для поиска нелинейных закономерностей в данных. Во время обучения нейронной сети модель автоматически изучает оптимальные пересечения функций для работы с входными данными, чтобы минимизировать потери.
В следующих разделах мы подробнее рассмотрим, как работают нейронные сети.
[[["Прост для понимания","easyToUnderstand","thumb-up"],["Помог мне решить мою проблему","solvedMyProblem","thumb-up"],["Другое","otherUp","thumb-up"]],[["Отсутствует нужная мне информация","missingTheInformationINeed","thumb-down"],["Слишком сложен/слишком много шагов","tooComplicatedTooManySteps","thumb-down"],["Устарел","outOfDate","thumb-down"],["Проблема с переводом текста","translationIssue","thumb-down"],["Проблемы образцов/кода","samplesCodeIssue","thumb-down"],["Другое","otherDown","thumb-down"]],["Последнее обновление: 2024-11-07 UTC."],[[["This module explores neural networks, a model architecture designed to automatically identify nonlinear patterns in data, eliminating the need for manual feature cross experimentation."],["You will learn the fundamental components of a deep neural network, including nodes, hidden layers, and activation functions, and how they contribute to prediction."],["The module covers the training process of neural networks, using the backpropagation algorithm to optimize predictions and minimize loss."],["Additionally, you will gain insights into how neural networks handle multi-class classification problems using one-vs.-all and one-vs.-one approaches."],["This module builds on prior knowledge of machine learning concepts such as linear and logistic regression, classification, and working with numerical and categorical data."]]],[]]