Esta página contiene términos del glosario de Agentic. Para consultar todos los términos del glosario, haz clic aquí.
A
actúa
Es una etapa del bucle de agente en la que el agente ejecuta la acción elegida durante la etapa de razonamiento. Por ejemplo, la etapa de acción podría enviar una solicitud a la API.
acción
En el aprendizaje por refuerzo, es el mecanismo por el cual el agente realiza la transición entre los estados del entorno. El agente elige la acción con una política.
espacio de acción
Es el conjunto de recursos que un agente puede usar para realizar una tarea. El espacio de acción puede incluir las herramientas y las APIs que el agente puede invocar, y los permisos que tiene el agente. En general, el espacio de acción debe ser lo suficientemente grande para que el agente realice la tarea. Si el espacio de acción es demasiado pequeño, es posible que el agente no tenga suficientes recursos para realizar la tarea. Si el espacio de acción es demasiado grande, el agente tiende a ser más propenso a errores.
agente
Software que puede razonar sobre las entradas del usuario para planificar y ejecutar acciones en nombre del usuario.
En el aprendizaje por refuerzo, un agente es la entidad que usa una política para maximizar el retorno esperado que se obtiene de la transición entre los estados del entorno.
agéntico/agéntica
Forma adjetiva de agente. El término "agéntico" se refiere a las cualidades que poseen los agentes (como la autonomía).
Bucle de agente
Es un ciclo por el que itera un agente hasta que se cumple una condición de finalización. Por lo general, el ciclo consta de las siguientes cuatro etapas:
flujo de trabajo con agentes
Es un proceso dinámico en el que un agente planifica y ejecuta acciones de forma autónoma para lograr un objetivo. El proceso puede implicar razonamiento, invocar herramientas externas y corregir su plan por sí mismo.
Organización de agentes
La administración y el enrutamiento centralizados de tareas en varios subagentes o llamadas a LLM La orquestación de agentes desglosa las tareas complejas en subtareas más pequeñas y las asigna a los subagentes más capaces.
Agente autónomo
Un agente que trabaja para alcanzar un objetivo complejo a través de la planificación, la acción y la adaptación sin intervención humana continua.
E
Agente evaluador
Es un agente que evalúa los resultados de otro agente antes de que se finalicen. Puedes imaginar un agente que fabrica un producto y otro agente independiente, el agente evaluador, que prueba ese producto antes de que se lance.
Critic es sinónimo de agente evaluador.
F
comentarios
Es una etapa de un bucle agentic en la que el agente evalúa la acción que se tomó durante la etapa de acción. Por ejemplo, si el agente envió una solicitud a la API durante la etapa de acción, la etapa de comentarios podría determinar si la respuesta de la API fue exitosa.
G
Modelos de Gemini
Modelos multimodales de última generación basados en Transformer de Google. Los modelos de Gemini están diseñados específicamente para integrarse con agentes.
Los usuarios pueden interactuar con los modelos de Gemini de varias maneras, como a través de una interfaz de diálogo interactiva y de SDKs.
Agentes generativos (simulacros)
Agentes dotados de personalidades, recuerdos y rutinas únicos que simulan el comportamiento humano realista.
Consulta Generative Agents: Interactive Simulacra of Human Behavior para obtener más detalles.
M
Agente de administración
Es un agente que controla uno o más subagentes.
Colaboración de varios agentes
Es un framework en el que varios agentes de IA especializados interactúan, debaten o se pasan tareas entre sí para resolver un problema complejo.
O
observar
Es una etapa del ciclo agentic en la que el agente examina o evalúa algún aspecto de su progreso. Por ejemplo, supongamos que la etapa act genera algo de código. Por lo tanto, es posible que la etapa de observación ejecute pruebas en el código generado.
P
plan-and-solve
Una estrategia basada en agentes en la que el modelo primero redacta un plan explícito de varios pasos antes de intentar ejecutar cualquier acción.
complemento
Es una herramienta modular y estandarizada que se puede conectar fácilmente a un agente para ampliar sus capacidades. Por ejemplo, un complemento de GitHub permite que los agentes realicen acciones como leer problemas de GitHub y crear solicitudes de extracción.
Memoria procedimental
En los agentes, el conocimiento de cómo hacer algo. Por ejemplo, un agente podría desarrollar una memoria procedimental de cómo buscar en la Web y, luego, mostrar los tres sitios principales.
R
Reason
Es una etapa del bucle agentic en la que el agente determina qué hacer. Por ejemplo, el agente podría determinar que se debe enviar una solicitud a una API en particular.
reflexión
Estrategia para mejorar la calidad de un flujo de trabajo basado en agentes que consiste en examinar (reflexionar sobre) el resultado de un paso antes de pasarlo al siguiente.
A menudo, el examinador es el mismo LLM que generó la respuesta (aunque podría ser un LLM diferente). ¿Cómo podría el mismo LLM que generó una respuesta ser un juez imparcial de su propia respuesta? El "truco" consiste en poner al LLM en un estado mental crítico (reflexivo). Este proceso es análogo al de un escritor que usa una mentalidad creativa para escribir un primer borrador y, luego, cambia a una mentalidad crítica para editarlo.
Por ejemplo, imagina un flujo de trabajo con agentes cuyo primer paso es crear texto para tazas de café. La instrucción para este paso podría ser la siguiente:
Eres creativo. Genera texto original y humorístico de menos de 50 caracteres adecuado para una taza de café.
Ahora, imagina la siguiente instrucción reflexiva:
Eres bebedor de café. ¿Considerarías humorística la respuesta anterior?
Luego, el flujo de trabajo podría pasar solo el texto que recibe una puntuación de reflexión alta a la siguiente etapa.
Agente del router
Es un agente que clasifica la búsqueda del usuario y, luego, invoca al agente más adecuado para controlarla.
S
autocorrección
Es la capacidad de un agente para detectar un error en su propio resultado y, luego, probar un enfoque diferente.
state
En el aprendizaje por refuerzo, son los valores de los parámetros que describen la configuración actual del entorno, que el agente usa para elegir una acción.
Agente de máquina de estados
Un agente cuyos flujos de trabajo están sujetos a reglas estrictas. En general, los agentes de máquinas de estados cometen menos errores que los agentes autónomos, pero no tienen la libertad de adaptarse a situaciones fuera de sus restricciones.
agente secundario
Es un modelo especializado y enfocado que invoca un agente administrador para controlar un subconjunto específico de un problema más grande. Por lo general, los subagentes tienen un espacio de acción más reducido que los agentes.
T
condición de finalización
En la IA agéntica, son los criterios predefinidos que le indican al agente que deje de iterar. Por ejemplo, estas son algunas condiciones de finalización posibles:
- El agente completó el objetivo correctamente.
- El agente no puede usar más recursos.
- Un human-in-the-loop detectó un problema.
En el aprendizaje por refuerzo, son las condiciones que determinan cuándo finaliza un episodio, por ejemplo, cuando el agente alcanza un estado determinado o supera un umbral de transiciones de estado. Por ejemplo, en tres en raya, un episodio finaliza cuando un jugador marca tres espacios consecutivos o cuando se marcan todos los espacios.