¿Qué es el aprendizaje automático?

El aprendizaje automático (AA) impulsa algunas de las tecnologías más importantes que usamos, desde apps de traducción hasta vehículos autónomos. En este curso, se explican los conceptos básicos del AA.

El AA ofrece una nueva manera de resolver problemas, responder preguntas complejas y crear contenido nuevo. El AA puede predecir el clima, estimar los tiempos de viaje, recomendar canciones, autocompletar oraciones, resumir artículos y generar imágenes nunca antes vistas.

En términos básicos, el AA es el proceso de entrenamiento de un software, llamado model, para realizar predicciones útiles o generar contenido a partir de datos.

Por ejemplo, supongamos que queremos crear una app para predecir la lluvia. Podríamos usar un enfoque tradicional o uno de AA. Con un enfoque tradicional, crearíamos una representación basada en la física de la atmósfera y la superficie de la Tierra, mediante el cálculo de cantidades masivas de ecuaciones de dinámica de fluidos. Esto es increíblemente difícil.

Con un enfoque de AA, le daríamos a un modelo de AA enormes cantidades de datos meteorológicos hasta que el modelo de AA finalmente aprendió la relación matemática entre los patrones climáticos que producen cantidades diferentes de lluvia. Entonces, le daríamos al modelo los datos meteorológicos actuales y predeciría la cantidad de lluvia.

Comprueba tu comprensión

¿Qué es un “modelo” en el aprendizaje automático?
Un modelo es una relación matemática derivada de los datos que usa un sistema de AA para hacer predicciones
Un modelo es una pieza de hardware informático.
Un modelo es una representación más pequeña de lo que se estudia.

Tipos de sistemas de AA

Los sistemas de AA se dividen en una o más de las siguientes categorías según cómo aprenden a hacer predicciones o generar contenido:

  • Aprendizaje supervisado
  • Aprendizaje no supervisado
  • Aprendizaje por refuerzo
  • IA generativa

Aprendizaje supervisado

Los modelos de aprendizaje supervisado pueden hacer predicciones después de ver muchos datos con las respuestas correctas y, luego, descubrir las conexiones entre los elementos de los datos que producen las respuestas correctas. Esto es como un estudiante que aprende nuevo material al estudiar exámenes antiguos que contienen tanto preguntas como respuestas. Una vez que el estudiante se entrenó en una cantidad suficiente de exámenes antiguos, está bien preparado para realizar un examen nuevo. Estos sistemas de AA están “supervisados” en el sentido de que un ser humano proporciona los datos del sistema de AA con los resultados correctos conocidos.

Dos de los casos de uso más comunes para el aprendizaje supervisado son la regresión y la clasificación.

Regresión

Un modelo de regresión predice un valor numérico. Por ejemplo, un modelo meteorológico que predice la cantidad de lluvia, en pulgadas o milímetros, es un modelo de regresión.

Consulta la siguiente tabla para ver más ejemplos de modelos de regresión:

Situación Datos de entrada posibles Predicción numérica
Precio futuro de la casa metros cuadrados, código postal, cantidad de habitaciones y baños, tamaño del lote, tasa de interés hipotecaria, tasa de impuestos sobre la propiedad, costos de construcción y cantidad de viviendas a la venta en el área. El precio de la casa.
Duración del viaje futuro Historial de condiciones de tráfico (recopiladas de smartphones, sensores de tráfico, transporte privado a pedido y otras aplicaciones de navegación), la distancia del destino y las condiciones climáticas Tiempo en minutos y segundos que tarda en llegar a un destino.

Clasificación

Los modelos de clasificación predicen la probabilidad de que algo pertenezca a una categoría. A diferencia de los modelos de regresión, cuyo resultado es un número, los modelos de clasificación generan un valor que indica si algo pertenece a una categoría en particular. Por ejemplo, los modelos de clasificación se usan para predecir si un correo electrónico es spam o si una foto contiene un gato.

Los modelos de clasificación se dividen en dos grupos: clasificación binaria y clasificación multiclase. Los modelos de clasificación binaria generan un valor de una clase que contiene solo dos valores, por ejemplo, un modelo que genera rain o no rain. Los modelos de clasificación de clases múltiples generan un valor de una clase que contiene más de dos valores, por ejemplo, un modelo que puede generar rain, hail, snow o sleet.

Comprueba tu comprensión

¿Qué tipo de modelo usarías si quisieras usar un modelo de AA para predecir el uso de energía de los edificios comerciales?
Regresión
El uso de energía se mide en kilovatios-hora (kWh), que es un número, por lo que querrás usar un modelo de regresión.
Clasificación
Los modelos de clasificación predicen si un elemento pertenece a una categoría y los modelos de regresión predicen un número. Debido a que el uso de energía se mide en kilovatios-hora (kWh), que es un número, te recomendamos usar un modelo de regresión.

Aprendizaje no supervisado

Los modelos de aprendizaje no supervisado hacen predicciones a partir de datos que no contienen ninguna respuesta correcta. El objetivo de un modelo de aprendizaje no supervisado es identificar patrones significativos entre los datos. En otras palabras, el modelo no tiene sugerencias sobre cómo categorizar cada dato, pero debe inferir sus propias reglas.

Los modelos de aprendizaje no supervisado de uso general emplean una técnica llamada agrupamiento en clústeres. El modelo encuentra puntos de datos que demarcan agrupaciones naturales.

Imagen que muestra puntos de colores en clústeres.

Figura 1: Un modelo de AA que agrupa en clústeres datos similares

Una imagen que muestra puntos de colores en clústeres encerrados en una forma y se unen entre sí.

Figura 2. Grupos de clústeres con demarcaciones naturales.

El agrupamiento en clústeres difiere de la clasificación porque tú no defines las categorías. Por ejemplo, un modelo no supervisado podría agrupar un conjunto de datos del clima en función de la temperatura, lo que revelaría segmentaciones que definen las estaciones. Luego, puedes intentar asignar nombres a esos clústeres en función de tu comprensión del conjunto de datos.

Una imagen que muestra puntos de colores en clústeres etiquetados como nieve, lluvia, granizo y sin lluvia.

Figura 3. Un modelo de AA que agrupa patrones climáticos similares en clústeres.

Una imagen que muestra puntos de colores en clústeres etiquetados como nieve, lluvia, granizo y sin lluvia, que están encerrados en una forma y se bordean entre sí.

Figura 4. Clústeres de patrones climáticos etiquetados como nieve, aguanieve, lluvia y sin lluvia.

Comprueba tu comprensión

¿Qué distingue un enfoque supervisado de uno no supervisado?
Un enfoque supervisado consiste en datos que contienen la respuesta correcta.
Un enfoque supervisado consiste en datos que contienen la respuesta correcta. El trabajo del modelo es encontrar conexiones en los datos que produzcan la respuesta correcta. Un enfoque no supervisado recibe datos sin la respuesta correcta. Su trabajo es encontrar agrupaciones en los datos.
Por lo general, un enfoque supervisado usa el agrupamiento en clústeres.
Los enfoques no supervisados usan el agrupamiento en clústeres.
Un enfoque no supervisado sabe cómo etiquetar clústeres de datos.
Un enfoque no supervisado no sabe qué significan los clústeres de datos. En función de tu comprensión de los datos, depende de ti definirlos.

Aprendizaje por refuerzo

Los modelos de aprendizaje por refuerzo realizan predicciones mediante recompensas o penalizaciones según las acciones realizadas en un entorno. Un sistema de aprendizaje por refuerzo genera una política que define la mejor estrategia para obtener la mayor cantidad de recompensas.

El aprendizaje por refuerzo se usa para entrenar a los robots a fin de que realicen tareas, como caminar por una habitación, y a programas de software, como AlphaGo, para jugar Go.

IA generativa

La IA generativa es una clase de modelos que crea contenido a partir de entradas del usuario. Por ejemplo, la IA generativa puede crear imágenes novedosas, composiciones musicales y chistes; puede resumir artículos, explicar cómo realizar una tarea o editar una foto.

La IA generativa puede tomar una variedad de entradas y crear una variedad de salidas, como texto, imágenes, audio y video. También puede tomar y crear combinaciones de estos. Por ejemplo, un modelo puede tomar una imagen como entrada y crear una imagen y texto como salida, o tomar una imagen y texto como entrada y crear un video como salida.

Podemos analizar los modelos generativos por sus entradas y salidas, que por lo general se escriben como “tipo de entrada” a “tipo de salida”. Por ejemplo, la siguiente es una lista parcial de algunas entradas y salidas para modelos generativos:

  • Texto a texto
  • Texto a imagen
  • Texto a video
  • Texto a código
  • Texto a voz
  • Imagen y texto a imagen

En la siguiente tabla, se enumeran ejemplos de modelos generativos, su entrada y un ejemplo de su posible resultado:

Modelo Entrada Resultado de ejemplo
Texto a texto ¿Quién inventó la carrera Le Mans? Las 24 Horas de Le Mans fue fundada por el Automobile Club de l'Ouest (ACO), una organización de automovilismo fundada en 1906. La primera carrera se realizó el 26 y el 27 de mayo de 1923 en el Circuito de Sarthe, un circuito vial de 13.426 kilómetros (13.345 kilómetros) situado cerca de la ciudad de Le Mans, en Francia. Originalmente, se concibió como una forma de promover el ACO y la región de Sarthe.
Fuente: Bard
Texto a imagen Un pulpo alienígena flota en un portal y lee un periódico. Imagen de una caricatura de un pulpo.
Fuente: Imagen
Texto a video Un oso de peluche fotorrealista nadando en el océano en San Francisco. El oso de peluche se sumerge en el agua. El oso de peluche nada bajo el agua con peces de colores. Un oso panda nadando bajo el agua. Video de un oso de peluche nadando bajo el agua.
Fuente: Phenaki
Texto a código Escribe un bucle de Python que se repita en una lista de números y, luego, imprima los números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Fuente: Bard
Imagen a texto Imagen de un flamenco. Este es un flamenco. Se encuentran en el Caribe.
Fuente: Google DeepMind

¿Cómo funciona la IA generativa? En un nivel alto, los modelos generativos aprenden patrones en los datos con el objetivo de producir datos nuevos pero similares. Los modelos generativos son como los siguientes:

  • Comediantes que aprenden a imitar a los demás observando los comportamientos y el estilo de hablar de las personas
  • Artistas que aprenden a pintar con un estilo particular estudiando muchas pinturas de ese estilo
  • hacer covers de bandas que aprenden a sonar como un grupo de música específico escuchando mucha música de ese grupo

Para producir resultados únicos y creativos, los modelos generativos se entrenan inicialmente con un enfoque no supervisado, en el que el modelo aprende a imitar los datos con los que se entrena. A veces, el modelo se entrena aún más mediante el aprendizaje supervisado o por refuerzo sobre datos específicos relacionados con tareas que se le puede pedir al modelo que realice, por ejemplo, resumir un artículo o editar una foto.

La IA generativa es una tecnología que evoluciona rápidamente y cuenta con nuevos casos de uso que se descubren de forma constante. Por ejemplo, los modelos generativos ayudan a las empresas a definir mejor sus imágenes de productos de comercio electrónico, ya que quitan automáticamente fondos distractores o mejoran la calidad de las imágenes de baja resolución.