AI-агенты
AI-агенты — это современный подход к построению приложений на основе искусственного интеллекта и нейросетей. Агенты расширяют возможности больших языковых моделей и служат основой для построения чат-ботов, ассистентов и голосовых интерфейсов, помогая автоматизировать разнообразные рутинные задачи.
Агенты состоят из четырех ключевых компонентов:
- LLM — сама языковая модель с зафиксированными настройками.
- Инструкция (prompt) — описывает поведение и роль агента.
- Инструменты (tools) — позволяют агенту использовать внешние возможности, например API, функции или поиск по интернету.
- Память (memory) — отвечает за хранение контекста и истории взаимодействия.
Такая архитектура позволяет создавать текстовые и голосовые агенты, которые ведут себя более естественно и автономно, чем классические чат-боты.
Разработка агентов в AI Studio
AI Studio имеет все необходимое для создания AI-агентов: модели с поддержкой вызова функций и форматирования ответа, готовые настраиваемые инструменты для RAG-сценариев и поиска в интернете, а также MCP Hub, который позволяет подключать внешние API через MCP-серверы.
AI Studio позволяет создавать агентов разными способами:
- в AI Playground
; - с помощью конструктора спецификаций
Yandex Workflows; - с помощью Responses API или Realtime API;
- через опенсорс-фреймворки, например OpenAI SDK, LangGraph или LangChain.
Инструменты
Агенты могут автоматически вызывать инструменты, чтобы получить дополнительную информацию для генерации или выполнить необходимые действия. В AI Studio доступны следующие готовые инструменты:
- Retrieval Tool – реализует сценарии RAG и позволяет AI-агенту искать информацию для ответа в ваших файлах (базе знаний). Вы можете загрузить документы базы знаний в консоли управления, через Vector Store API или через Files API и создать поисковый индекс. Поисковые индексы хранят информацию из документов в векторном виде и позволяют агентам использовать ее при ответе.
- Web Search Tool — позволяет агенту искать информацию в интернете через поисковую базу Яндекса, чтобы обогащать ответ актуальными сведениями по теме запроса. Подробнее про использование инструмента поиска в интернете.
- File Search Tool — позволяет агенту искать информацию в пользовательских файлах. Подробнее про использование инструмента поиска в файлах.
- MCP Tool — отвечает за подключение к MCP-серверам для работы со сторонними API.
В разделе MCP Hub вы можете создавать и настраивать подключения к новым и уже существующим MCP-серверам, а также следить за их состоянием.
API создания агентов
AI Studio предоставляет два OpenAI-совместимых API для разработки различных типов агентов. Оба API сохраняют данные о состоянии клиента между запросами и решают одни и те же задачи — подключают модели, инструменты и память, — но оптимизированы под разные типы взаимодействия в зависимости от агента.
- Responses API – это API для текстовых сценариев. Агенты, созданные с помощью Responses API, учитывают контекст переписки и могут автоматически вызывать подключенные инструменты. Responses API поддерживает работу с любыми моделями.
- Realtime API — это API для реализации голосовых сценариев. API предназначен для работы со специализированными мультимодальными моделями, которые принимают аудио на вход и синтезируют ответ в виде аудио. Realtime API поддерживает все доступные инструменты, включая Retrieval и WebSearch.
Конструктор рабочих процессов
Конструктор рабочих процессов позволяет собирать сложные сценарии на базе AI с помощью готовых шагов автоматизации и управления. Конструктор подойдет тем, кто предпочитает визуальные редакторы и платформы Low-code.
Подробнее о рабочих процессах и шагах автоматизации см. в документации Yandex Workflows.