Glossário de machine learning: Agentic

Esta página contém termos do glossário de agentes. Para conferir todos os termos do glossário, clique aqui.

A

Atue

#agent

Uma etapa no loop de agente em que o agente executa a ação escolhida durante a etapa de motivo. Por exemplo, a etapa de ação pode enviar uma solicitação de API.

ação

#agent

Na aprendizagem por reforço, o mecanismo pelo qual o agente faz a transição entre estados do ambiente. O agente escolhe a ação usando uma política.

espaço de ação

#agent

O conjunto de recursos que um agente pode usar para realizar uma tarefa. O espaço de ação pode incluir as ferramentas e APIs que o agente pode invocar e as permissões que ele tem. Em geral, o espaço de ação precisa ser grande o suficiente para que o agente execute a tarefa. Se o espaço de ação for muito pequeno, o agente poderá não ter recursos suficientes para realizar a tarefa. Se o espaço de ação for muito grande, o agente vai ter mais chances de cometer erros.

agente

#generativeAI
#agent

Software que pode raciocinar sobre as entradas do usuário para planejar e executar ações em nome dele.

No aprendizado por reforço, um agente é a entidade que usa uma política para maximizar o retorno esperado obtido com a transição entre estados do ambiente.

agêntico / agêntica

#generativeAI
#agent

A forma adjetiva de agente. Agêntico se refere às qualidades que os agentes têm (como autonomia).

loop agêntico

#agent

Um ciclo que um agente percorre até que uma condição de encerramento seja atendida. O ciclo normalmente consiste nas quatro etapas a seguir:

  1. Observe
  2. Motivo
  3. Agir
  4. Feedback

fluxo de trabalho com agentes

#generativeAI
#agent

Um processo dinâmico em que um agente planeja e executa ações de forma autônoma para alcançar uma meta. O processo pode envolver raciocínio, invocação de ferramentas externas e autocorreção do plano.

orquestração de agentes

#agent

O gerenciamento e o roteamento centralizados de tarefas em vários subagentes ou chamadas de LLM. A orquestração de agentes divide tarefas complexas em subtarefas menores e as atribui aos subagentes mais eficientes.

agente autônomo

#agent

Um agente que trabalha para alcançar uma meta complexa planejando, agindo e se adaptando sem intervenção humana contínua.

E

agente avaliador

#agent

Um agente que avalia os resultados de outro agente antes que eles sejam finalizados. Imagine um agente fabricando um produto e outro, o agente avaliador, testando esse produto antes do lançamento.

Critic é um sinônimo de agente avaliador.

F

feedback

#agent

Uma etapa em um ciclo de agente em que o agente avalia a ação realizada durante a etapa de ação. Por exemplo, se o agente enviou uma solicitação de API durante a etapa de ação, a etapa de feedback pode determinar se a resposta da API foi bem-sucedida.

G

Modelos do Gemini

#generativeAI
#agent

Modelos multimodais de última geração do Google baseados em Transformer. Os modelos do Gemini foram criados especificamente para integração com agentes.

Os usuários podem interagir com os modelos do Gemini de várias maneiras, incluindo uma interface de diálogo interativa e SDKs.

agentes generativos (simulacros)

#agent

Agentes com personalidades, memórias e rotinas únicas que simulam o comportamento humano realista.

Consulte Agentes generativos: simulacros interativos do comportamento humano para mais detalhes.

M

agente de gerenciamento

#agent

Um agente que controla um ou mais subagentes.

colaboração multiagente

#agent

Um framework em que vários agentes de IA especializados interagem, debatem ou passam tarefas uns para os outros para resolver um problema complexo.

O

observar

#agent

Uma etapa no ciclo de agente em que o agente examina ou avalia algum aspecto do progresso dele. Por exemplo, suponha que a etapa act gere algum código. Como consequência, a etapa observe pode executar testes no código gerado.

P

plan-and-solve

#agent

Uma estratégia de agente em que o modelo primeiro cria um plano explícito de várias etapas antes de tentar executar qualquer ação.

plug-in

#agent

Uma ferramenta modular padronizada que pode ser facilmente anexada a um agente para ampliar as capacidades dele. Por exemplo, um plug-in do GitHub permite que os agentes realizem ações como ler problemas do GitHub e criar solicitações de envio.

memória procedural

#agent

Em agentes, o conhecimento de como fazer algo. Por exemplo, um agente pode desenvolver uma memória procedural de como pesquisar na Web e mostrar os três principais sites.

R

reason

#agent

Uma etapa no loop de agente em que o agente determina o que fazer. Por exemplo, o agente pode determinar que uma solicitação de API específica deve ser enviada.

reflexão

#generativeAI
#agent

Uma estratégia para melhorar a qualidade de um fluxo de trabalho de agente examinando (refletindo sobre) a saída de uma etapa antes de passar essa saída para a próxima etapa.

O examinador geralmente é o mesmo LLM que gerou a resposta (embora possa ser um LLM diferente). Como o mesmo LLM que gerou uma resposta pode ser um juiz imparcial dela? O "truque" é colocar o LLM em uma mentalidade crítica (reflexiva). Esse processo é semelhante a um escritor que usa uma mentalidade criativa para escrever um primeiro rascunho e depois muda para uma mentalidade crítica para editá-lo.

Por exemplo, imagine um fluxo de trabalho com agentes em que a primeira etapa é criar texto para xícaras de café. O comando para esta etapa pode ser:

Você é um criativo. Gere um texto original e divertido de menos de 50 caracteres adequado para uma xícara de café.

Agora imagine o seguinte comando reflexivo:

Você gosta de café. Você acharia a resposta anterior engraçada?

O fluxo de trabalho pode passar para a próxima etapa apenas o texto que recebe uma pontuação alta de reflexão.

agente de roteador

#agent

Um agente que classifica uma consulta do usuário e invoca o agente mais adequado para processá-la.

S

autocorreção

#agent

A capacidade de um agente detectar um erro na própria saída e tentar uma abordagem diferente.

estado

#agent

No aprendizado por reforço, os valores de parâmetro que descrevem a configuração atual do ambiente, que o agente usa para escolher uma ação.

agente de máquina de estado

#agent

Um agente cujos fluxos de trabalho são restritos por regras rígidas. Os agentes de máquina de estado geralmente cometem menos erros do que os autônomos, mas não têm a liberdade de se adaptar a situações fora das restrições.

subagente

#agent

Um modelo especializado e focado invocado por um agente gerente para lidar com um subconjunto específico de um problema maior. Os subagentes geralmente têm um espaço de ação menor do que os agentes.

T

condição de encerramento

#agent

Na IA autônoma, os critérios predefinidos que dizem ao agente para parar de iterar. Por exemplo, confira algumas condições de encerramento possíveis:

  • O agente concluiu a meta.
  • O agente não pode usar mais recursos.
  • Um human-in-the-loop detectou um problema.

No aprendizado por reforço, as condições que determinam quando um episódio termina, como quando o agente atinge um determinado estado ou excede um número limite de transições de estado. Por exemplo, em jogo da velha, um episódio termina quando um jogador marca três espaços consecutivos ou quando todos os espaços são marcados.