ArXiv · Перевод

OpenSeeker-v2: Прорыв в разработке агентов поиска

Авторы оригиналаYuwen Du, Rui Ye, Shuo Tang, Keduan Huang, Xinyu Zhu, Yuzhu Cai, Siheng Chen

ПереводKENDEV AI

Дата2026-05-06

Теги

агенты поискаглубокие способностиязыковые моделиискусственный интеллектисследования

## Перевод abstract Глубокие способности поиска стали незаменимой компетенцией для передовых агентов больших языковых моделей (LLM), однако их развитие по-прежнему доминируется промышленными гигантами. Типичная промышленная схема включает в себя ресурсоемкий процесс, охватывающий предобучение, непрерывное предобучение (CPT), контролируемую донастройку (SFT) и обучение с подкреплением (RL). В этом отчете мы показываем, что, используя информативные и сложные траектории, простой подход SFT может оказаться удивительно эффективным для обучения передовых агентов поиска. Введя три простых модификации синтеза данных: увеличение размера графа знаний для более богатого исследования, расширение набора инструментов для более широкой функциональности и строгую фильтрацию по количеству шагов, мы устанавливаем более сильную базу. Обученный на всего лишь 10,6 тыс. данных, наш OpenSeeker-v2 достигает передового уровня производительности по 4 бенчмаркам (агенты размером 30B с парадигмой ReAct): 46,0% на BrowseComp, 58,1% на BrowseComp-ZH, 34,6% на Humanity's Last Exam и 78,0% на xbench, превосходя даже Tongyi DeepResearch, обученный с тяжелым процессом CPT+SFT+RL, который достигает 43,4%, 46,7%, 32,9% и 75,0% соответственно. Примечательно, что OpenSeeker-v2 представляет собой первого агента поиска с передовым уровнем производительности в своем классе и парадигме, разработанного исключительно академической командой с использованием только SFT. Мы рады открыть исходный код весов модели OpenSeeker-v2 и поделиться нашими простыми, но эффективными находками, чтобы сделать исследование передовых агентов поиска более доступным для сообщества. ## Ключевые выводы 1. Разработка агентов поиска с глубокими способностями может быть успешно выполнена с использованием простого подхода SFT, что ставит под сомнение необходимость в сложных и ресурсоемких методах. 2. Введение модификаций синтеза данных, таких как увеличение графа знаний и расширение набора инструментов, значительно улучшает результаты агентов поиска. 3. OpenSeeker-v2 достигает передовой производительности на нескольких бенчмарках, превосходя существующие решения, разработанные с использованием более сложных подходов. 4. Модель была разработана исключительно академической командой, что подчеркивает важность академических исследований в области искусственного интеллекта. 5. Открытие исходного кода модели делает исследования в данной области более доступными для широкой аудитории. ## Практическая значимость Результаты работы могут быть применены в различных областях, включая разработку поисковых систем, улучшение взаимодействия с пользователями в приложениях и системах, а также в образовательных технологиях. Агенты с глубокими способностями поиска могут значительно повысить эффективность обработки информации и помочь пользователям находить необходимые данные быстрее и точнее. ## Ограничения и критика Несмотря на достижения, работа не учитывает возможные ограничения в контексте масштабируемости и применения на более сложных задачах. Также стоит отметить, что эффективность модели может варьироваться в зависимости от специфики задач и контекста применения. Кроме того, отсутствие более глубокого анализа влияния различных модификаций на производительность может оставить пробелы в понимании механизмов, стоящих за успехом OpenSeeker-v2.