¿Qué es el aprendizaje automático?

El aprendizaje automático (AA) impulsa algunas de las tecnologías más importantes que usamos, desde apps de traducción hasta vehículos autónomos. En este curso, se explican los principales subyacentes del AA.

El AA ofrece una nueva forma de resolver problemas, responder preguntas complejas y crear contenido. El AA puede predecir el clima, estimar tiempos de viaje, recomendar canciones, autocompletar oraciones, resumir artículos y generar imágenes nunca antes vistas.

En términos básicos, el AA es el proceso de entrenar una pieza de software, llamada modelo, para que sea útil predicciones o generar contenido a partir de de datos no estructurados.

Por ejemplo, supongamos que queremos crear una app para predecir la lluvia. Podríamos usan un enfoque tradicional o de AA. Con una arquitectura enfoque, crearíamos una representación basada en la física de la atmósfera de la Tierra y la superficie, calculando cantidades masivas de ecuaciones de dinámica de fluidos. Este es increíblemente difícil.

Con un enfoque de AA, le daríamos a un modelo de AA enormes cantidades de datos meteorológicos. hasta que el modelo de AA finalmente aprendió la relación matemática entre los patrones climáticos que producen diferentes cantidades de lluvia. Luego, le daríamos a la para modelar los datos meteorológicos actuales y predecir la cantidad de lluvias.

Comprueba tu comprensión

¿Qué es un "modelo"? en el aprendizaje automático?
Un modelo es una relación matemática derivada de datos que un AA que el sistema usa para hacer predicciones
Un modelo es una pieza de hardware informático
Un modelo es una representación más pequeña de lo que estás estudiando.

Tipos de sistemas de AA

Los sistemas de AA se clasifican en una o más de las siguientes categorías según cómo aprender a hacer predicciones o generar contenido:

  • Aprendizaje supervisado
  • Aprendizaje no supervisado
  • Aprendizaje por refuerzo
  • IA generativa

Aprendizaje supervisado

Aprendizaje supervisado los modelos pueden hacer predicciones después de ver muchos datos con las respuestas correctas y luego descubrir las conexiones entre los elementos en los datos que a producir las respuestas correctas. Es como un estudiante que aprende material nuevo estudiando exámenes antiguos que contienen tanto preguntas como respuestas. Una vez que el estudiante capacitado con suficientes exámenes antiguos, el estudiante está bien preparado para rendir un nuevo examen. Estos sistemas de AA son “supervisados” en el sentido de que un humano le da al sistema de AA datos con los resultados correctos conocidos.

Dos de los casos de uso más comunes del aprendizaje supervisado son la regresión y clasificación.

Regresión

Un modelo de regresión predice un un valor numérico. Por ejemplo, un modelo meteorológico que predice la cantidad de lluvia, en pulgadas o milímetros, es un modelo de regresión.

Consulta la siguiente tabla para ver más ejemplos de modelos de regresión:

Situación Posibles datos de entrada Predicción numérica
Precio de la casa futuro En metros cuadrados, código postal, cantidad de habitaciones y baños, tamaño del lote tasa de interés hipotecaria, tasa impositiva a la propiedad, costos de construcción y la cantidad de viviendas en venta en el área. El precio de la casa.
Tiempo de viaje futuro Condiciones históricas de tráfico (obtenidas de smartphones, tráfico transporte privado a pedido y otras aplicaciones de navegación), la distancia desde destino y las condiciones climáticas. Es el tiempo en minutos y segundos que tarda en llegar a un destino.

Clasificación

Los modelos de clasificación predicen la probabilidad de que algo pertenezca a una categoría. A diferencia de los modelos de regresión, cuyo resultado es un número, los modelos de clasificación generan un valor que establece si algo pertenece o no a una categoría en particular. Por ejemplo: se usan para predecir si un correo electrónico es spam o si una foto contiene un gato.

Los modelos de clasificación se dividen en dos grupos: clasificación binaria y y la clasificación multiclase. Los modelos de clasificación binaria generan un valor de un que contiene solo dos valores, por ejemplo, un modelo que genera rain o no rain. Los modelos de clasificación multiclase generan un valor de un que contenga más de dos valores, por ejemplo, un modelo que puede generar rain, hail, snow o sleet.

Comprueba tu comprensión

Si quisieras usar un modelo de AA para predecir el uso de energía de edificios, ¿qué tipo de modelo usarías?
Regresión
El uso de energía se mide en kilovatios-hora (kWh), que es un número, así que deberías usar un modelo de regresión.
Clasificación
Los modelos de clasificación predicen si algo pertenece o no a una categoría, mientras que los modelos de regresión predicen un número. Debido a que el uso de la energía se mide en kilovatios-hora (kWh), que es un número, deberías usar un modelo de regresión.

Aprendizaje no supervisado

Aprendizaje no supervisado los modelos hacen predicciones recibiendo datos que no contienen información respuestas. El objetivo de un modelo de aprendizaje no supervisado es identificar patrones entre los datos. En otras palabras, el modelo no tiene pistas sobre cómo categorizar cada dato, sino que debe inferir sus propias reglas.

Un modelo de aprendizaje no supervisado de uso frecuente emplea una técnica agrupamiento en clústeres. El modelo encuentra datos que demarcan agrupaciones naturales.

Una imagen que muestra puntos de colores en grupos.

Figura 1. Un modelo de AA que agrupa en clústeres datos similares.

Una imagen que muestra puntos de colores en clústeres encerrados en una forma con bordes entre sí.

Figura 2. Grupos de clústeres con demarcaciones naturales.

El agrupamiento en clústeres difiere de la clasificación porque las categorías no están definidas por ti. Por ejemplo, un modelo no supervisado puede agrupar en clústeres un conjunto de datos meteorológicos basado en temperatura, lo que revela segmentos que definen las estaciones. Es posible que de nombrar esos clústeres según tu comprensión del conjunto de datos.

Una imagen que muestra puntos de colores en clústeres etiquetados como nieve, lluvia, granizo y ausencia de lluvia.

Figura 3. Un modelo de AA que agrupa en clústeres patrones climáticos similares

Una imagen que muestra puntos de colores en clústeres etiquetados como nieve, lluvia, granizo y no lluvia, encerrados en una forma que se bordean entre sí.

Figura 4. Clústeres de patrones climáticos etiquetados como nieve, aguanieve, lluvia y sin lluvia.

Comprueba tu comprensión

¿Qué distingue a un enfoque supervisado de uno no supervisado?
En un enfoque supervisado, se proporcionan datos que contienen la respuesta correcta.
En un enfoque supervisado, se proporcionan datos que contienen la respuesta correcta. El trabajo del modelo es encontrar conexiones en los datos que produzcan la respuesta una respuesta en particular. En un enfoque no supervisado, se obtienen datos sin la respuesta correcta. Su trabajo es encontrar agrupaciones en los datos.
Un enfoque supervisado suele usar el agrupamiento en clústeres.
Un enfoque no supervisado usa el agrupamiento en clústeres.
Un enfoque no supervisado sabe cómo etiquetar clústeres de datos.
En un enfoque no supervisado, no se sabe qué significan los clústeres de datos. Según tu comprensión de los datos, depende de ti definirlos.

Aprendizaje por refuerzo

Aprendizaje por refuerzo Los modelos realizan predicciones obteniendo recompensas. o penalizaciones basadas en las acciones realizadas en un entorno. Un refuerzo de aprendizaje automático genera una política define la mejor estrategia para obtener la mayor cantidad de recompensas.

El aprendizaje por refuerzo se usa para entrenar a los robots con el objetivo de que realicen tareas como caminar alrededor de una habitación y los programas de software como AlphaGo de jugar Go.

IA generativa

La IA generativa es una clase de modelos que crea contenido a partir de la entrada del usuario. Por ejemplo, la IA generativa puede crear imágenes, composiciones musicales y chistes únicos; puede resumir artículos, explicar cómo realizar una tarea o editar una foto.

La IA generativa puede tomar una variedad de entradas y crear una variedad de salidas, como como texto, imágenes, audio y video. También puede tomar y crear combinaciones de estos. Por ejemplo, un modelo puede tomar una imagen como entrada y crear una imagen texto como salida, o tomar una imagen y texto como entrada, y crear un video como salida.

Podemos analizar los modelos generativos por sus entradas y salidas, que se suelen escribir como “tipo de entrada” a “tipo de salida”. Por ejemplo, el siguiente es un ejemplo una lista de algunas entradas y salidas para los modelos generativos:

  • Texto a texto
  • Texto a imagen
  • Texto a video
  • Texto a código
  • Texto a voz
  • Imagen y texto a imagen

En la siguiente tabla, se enumeran ejemplos de modelos generativos, sus entradas y un de su posible resultado:

Modelo Entrada Resultado de ejemplo
Texto a texto ¿Quién inventó la carrera Le Mans? Las 24 horas de Le Mans fue fundada por el Automobile Club de l'Ouest (ACO), una organización de automovilismo fundada en 1906. Se celebró la primera carrera el 26 y 27 de mayo de 1923, en el circuito de Sarthe, un metro Circuito de carreteras de 13.35 kilómetros ubicado cerca de la ciudad de Le Mans, en Francia. Originalmente, la carrera se concibió como una forma de promover el ACO y el Región de Sarthe.
Fuente: Bard
Texto a imagen Un pulpo alienígena flota a través de un portal leyendo un periódico. Imagen de un pulpo de dibujos animados. de
Fuente: Imagen
Texto a video Un oso de peluche fotorrealista está nadando en el océano en San Francisco. El osito de peluche se sumergirá en el agua. El oso de peluche sigue nadando por debajo el agua con peces de colores. Un oso panda nadando bajo el agua. Video de un oso de peluche nadando bajo el agua. de
Fuente: Phenaki
Texto a código Escribe un bucle de Python que reprima una lista de números y que imprima los números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Fuente: Bard
Imagen a texto Imagen de un flamenco. Este es el sonido que hacen los flamencos. Se encuentran en el Caribe.
Fuente: Google DeepMind

¿Cómo funciona la IA generativa? A un alto nivel, los modelos generativos aprenden patrones en los datos con el objetivo de producir datos nuevos pero similares. Generativa Los modelos son como los siguientes:

  • Los comediantes aprenden a imitar a los demás observando los comportamientos de las personas y estilo de conversación
  • Los artistas que aprenden a pintar de un estilo particular estudiando mucho pinturas de ese estilo
  • Bandas de covers que aprenden a sonar como un grupo específico de música escuchando mucha música de ese grupo

Para producir resultados únicos y creativos, los modelos generativos se entrenan inicialmente con un enfoque no supervisado, en el que el modelo aprende a imitar los datos que con el que se entrena el modelo. A veces, el modelo se entrena aún más con métodos supervisados aprendizaje por refuerzo en datos específicos relacionados con tareas que el modelo podría estar que se le solicitó realizar, por ejemplo, resumir un artículo o editar una foto.

La IA generativa es una tecnología que evoluciona rápidamente y tiene casos de uso nuevos de forma constante que se descubran. Por ejemplo, los modelos generativos ayudan a las empresas a definir mejor las imágenes de sus productos de comercio electrónico quitando automáticamente los fondos que distraigan o mejorar la calidad de las imágenes de baja resolución.