ArXiv · Перевод

LongSeeker: Эластичная оркестрация контекста для агентов долгосрочного поиска

Авторы оригиналаYijun Lu, Rui Ye, Yuwen Du, Jiajun Wang, Songhua Liu, Siheng Chen

ПереводKENDEV AI

Дата2026-05-07

Теги

агенты долгосрочного поискауправление контекстомContext-ReActLongSeekerискусственный интеллект

## Перевод abstract Агенты долгосрочного поиска должны управлять быстро растущим рабочим контекстом, пока они рассуждают, используют инструменты и наблюдают информацию. Наивное накопление всего промежуточного контента может перегрузить агента, увеличивая затраты и риск ошибок. Мы предлагаем, что эффективное управление контекстом должно быть адаптивным: части траектории агента поддерживаются на разных уровнях детализации в зависимости от их текущей актуальности для задачи. Для реализации этого принципа мы вводим Context-ReAct, общую агентную парадигму для эластичной оркестрации контекста, которая интегрирует рассуждение, управление контекстом и использование инструментов в едином цикле. Context-ReAct предоставляет пять атомарных операций: Пропустить, Сжать, Вернуться, Фрагмент и Удалить, которые позволяют агенту динамически изменять свой рабочий контекст, сохраняя важные доказательства, обобщая разрешенную информацию, отбрасывая бесполезные ветви и контролируя размер контекста. Мы доказываем, что оператор Сжать является выразительно полным, в то время как другие специализированные операторы обеспечивают гарантии эффективности и точности, которые снижают затраты на генерацию и риск галлюцинаций. Основываясь на этой парадигме, мы разрабатываем LongSeeker, агента долгосрочного поиска, настроенного от Qwen3-30B-A3B на 10k синтетических траекториях. На четырех представительных бенчмарках поиска LongSeeker достигает 61.5% на BrowseComp и 62.5% на BrowseComp-ZH, существенно превосходя Tongyi DeepResearch (43.2% и 46.7%) и AgentFold (36.2% и 47.3%). Эти результаты подчеркивают потенциал адаптивного управления контекстом, показывая, что агенты могут достигать более надежного и эффективного долгосрочного рассуждения, активно формируя свою рабочую память. ## Ключевые выводы 1. Эффективное управление контекстом должно быть адаптивным, поддерживая информацию на разных уровнях детализации в зависимости от актуальности. 2. Введенная парадигма Context-ReAct включает пять операций, позволяющих агентам динамически изменять рабочий контекст. 3. Оператор Сжать продемонстрировал выразительную полноту, в то время как другие операторы обеспечивают эффективность и точность. 4. LongSeeker значительно превзошел существующие системы на четырех бенчмарках поиска, демонстрируя высокую производительность. 5. Адаптивное управление контекстом может повысить надежность и эффективность долгосрочного рассуждения. ## Практическая значимость Данная работа имеет важное значение для разработки интеллектуальных агентов, которые могут эффективно обрабатывать большие объемы информации в условиях динамически меняющихся задач. Применение адаптивного управления контекстом может быть полезно в различных областях, таких как автоматизация бизнес-процессов, системы поддержки принятия решений, разработка чат-ботов и других интерфейсов взаимодействия с пользователем. ## Ограничения и критика Несмотря на достигнутые результаты, работа не учитывает возможные ограничения в реальных сценариях, таких как сложность интеграции с существующими системами или необходимость в дополнительной вычислительной мощности для обработки адаптивного контекста. Также не исследованы потенциальные этические аспекты использования таких агентов, включая вопросы конфиденциальности и безопасности данных.