Глоссарий машинного обучения: Агентный

На этой странице представлены термины из глоссария Агентского дела. Для просмотра всех терминов глоссария нажмите здесь .

А

действовать

#агент

Этап в цикле работы агента, на котором агент выполняет действие, выбранное на этапе обоснования . Например, на этапе выполнения действия может быть отправлен API-запрос.

действие

#агент

В обучении с подкреплением механизм, посредством которого агент переходит между состояниями окружающей среды , заключается в выборе действия с использованием стратегии .

пространство действий

#агент

Пространство действий — это набор ресурсов, которые агент может использовать для выполнения задачи. В него могут входить инструменты и API, которые агент может вызывать, а также его права доступа. В целом, пространство действий должно быть достаточно большим, чтобы агент мог выполнить задачу. Если пространство действий слишком мало, у агента может не хватать ресурсов для выполнения задачи. Если же пространство действий слишком велико, агент, как правило, становится более склонен к ошибкам.

агент

#генеративныйИИ
#агент

Программное обеспечение, способное анализировать вводимые пользователем данные для планирования и выполнения действий от его имени.

В обучении с подкреплением агент — это сущность, которая использует стратегию для максимизации ожидаемой отдачи от перехода между состояниями окружающей среды .

агентный

#генеративныйИИ
#агент

Прилагательная форма слова «агент» . «Агентный» относится к качествам, которыми обладают агенты (например, автономия).

агентный цикл

#агент

Цикл, который агент проходит до тех пор, пока не будет выполнено условие завершения . Цикл обычно состоит из следующих четырех этапов:

  1. Наблюдать
  2. Причина
  3. Действовать
  4. Обратная связь

агентский рабочий процесс

#генеративныйИИ
#агент

Динамический процесс, в котором агент автономно планирует и выполняет действия для достижения цели. Этот процесс может включать рассуждения, использование внешних инструментов и самокоррекцию плана.

оркестрация агентов

#агент

Централизованное управление и маршрутизация задач между несколькими суб-агентами или вызовами LLM. Управление работой агентов разбивает сложные задачи на более мелкие подзадачи и назначает их наиболее компетентным суб-агентам.

автономный агент

#агент

Агент, который работает над достижением сложной цели, планируя, действуя и адаптируясь без постоянного вмешательства человека.

Е

агент-оценщик

#агент

Агент, который оценивает результаты другого агента до того, как эти результаты будут окончательно утверждены. Можно представить, что один агент производит продукт, а другой агент — агент-оценщик — тестирует этот продукт перед его выпуском.

Критик — синоним оценщика-агента.

Ф

обратная связь

#агент

Этап в цикле работы агента, на котором агент оценивает действие, предпринятое на этапе выполнения . Например, если агент отправил API-запрос на этапе выполнения, этап обратной связи может определить, был ли ответ API успешным.

Г

модели Близнецов

#генеративныйИИ
#агент

Передовые многомодальные модели Google на основе Transformer . Модели Gemini специально разработаны для интеграции с агентами .

Пользователи могут взаимодействовать с моделями Gemini различными способами, в том числе через интерактивный диалоговый интерфейс и с помощью SDK.

генеративные агенты (симулякры)

#агент

Агенты, наделенные уникальными личностями, воспоминаниями и распорядком дня, имитирующими реалистичное человеческое поведение.

Подробности см. в книге «Генеративные агенты: интерактивные симулякры человеческого поведения» .

М

менеджер агент

#агент

Агент, контролирующий одного или нескольких субагентов .

многоагентное сотрудничество

#агент

Это платформа, в которой множество специализированных агентов искусственного интеллекта взаимодействуют, обсуждают или передают друг другу задачи для решения сложной проблемы.

О

наблюдать

#агент

Этап в цикле работы агента, на котором агент изучает или оценивает какой-либо аспект своего прогресса. Например, предположим, что на этапе действия генерируется некоторый код. Следовательно, на этапе наблюдения могут быть запущены тесты для сгенерированного кода.

П

планировать и решать

#агент

Агентная стратегия, при которой модель сначала составляет подробный многоэтапный план, прежде чем пытаться выполнить какие-либо действия.

плагин

#агент

Стандартизированный модульный инструмент, который легко подключается к агенту для расширения его возможностей. Например, плагин GitHub позволяет агентам выполнять такие действия, как чтение задач GitHub и создание запросов на слияние.

процедурная память

#агент

В агентах это означает знание того, как что-то делать. Например, агент может сформировать процедурную память о том, как искать информацию в интернете, а затем отображать три лучших сайта.

Р

причина

#агент

Этап в цикле работы агента, на котором агент определяет, что ему следует делать. Например, агент может определить, что необходимо отправить конкретный API-запрос.

отражение

#генеративныйИИ
#агент

Стратегия повышения качества рабочего процесса агента путем анализа (осмысления) результатов выполнения шага перед передачей этих результатов следующему шагу.

Часто экзаменатором выступает тот же самый магистр права , который подготовил ответ (хотя это может быть и другой магистр). Как может тот же самый магистр права, подготовивший ответ, быть справедливым судьей собственного ответа? «Хитрость» заключается в том, чтобы настроить магистра права на критический (рефлексивный) лад. Этот процесс аналогичен тому, как писатель использует творческий подход для написания первого черновика, а затем переключается на критический подход для его редактирования.

Например, представьте себе рабочий процесс агента, первым шагом которого является создание текста для кофейных кружек. Подсказка для этого шага может быть следующей:

Вы — творческая личность. Создайте юмористический, оригинальный текст длиной менее 50 символов, подходящий для кофейной кружки.

Теперь представьте себе следующую тему для размышления:

Вы пьёте кофе. Показался бы вам предыдущий ответ забавным?

В результате рабочий процесс может передавать на следующий этап только тот текст, который получил высокий балл за отражение.

агент маршрутизатора

#агент

Агент, который классифицирует запрос пользователя, а затем вызывает наиболее подходящего агента для его обработки.

С

самокоррекция

#агент

Способность агента обнаружить ошибку в собственном выводе и затем попробовать другой подход.

состояние

#агент

В обучении с подкреплением значения параметров, описывающих текущую конфигурацию среды, используются агентом для выбора действия .

агент конечного автомата

#агент

Агент , чьи рабочие процессы ограничены жесткими правилами. Агенты-конечные автоматы, как правило, совершают меньше ошибок, чем автономные агенты, но им не хватает свободы адаптироваться к ситуациям, выходящим за рамки их ограничений.

субагент

#агент

Специализированная, узконаправленная модель, используемая агентом-менеджером для решения конкретного подмножества более крупной проблемы. Как правило, суб-агенты имеют более узкое пространство действий , чем агенты.

Т

условие завершения

#агент

В агентном ИИ предопределенные критерии указывают агенту на необходимость прекращения итерации. Например, вот несколько возможных условий завершения:

В обучении с подкреплением условия определяют, когда заканчивается эпизод , например, когда агент достигает определенного состояния или превышает пороговое количество переходов между состояниями. Например, в крестиках-ноликах (также известных как «нолики») эпизод заканчивается либо когда игрок отмечает три клетки подряд, либо когда отмечены все клетки.