
Андрей Носов
Ведущий AI-архитектор, Raft
Кутузовский просп., д. 32, корп. 1
Кутузовская
Сегодня AI-агенты — это мощные одиночки. Но их истинный потенциал раскрывается в коллективной работе, когда они действуют как слаженный рой, решая комплексные задачи. Но как перейти от концепции к работающей системе? Как построить архитектуру, которая справится с тысячами запросов, обеспечит отказоустойчивость и не приведет к разорению на API-вызовах LLM?
В докладе представлю практический архитектурный план для построения производительных мультиагентных систем. Разберём, как использовать асинхронный, событийно-ориентированный подход для создания масштабируемой и изолированной среды, способной обрабатывать пиковые нагрузки. Покажу, как связка Kafka и stateful-движка обеспечивает высочайшую отказоустойчивость, позволяя системе «помнить» состояние и перезапускать сбойные задачи без потери данных.
Ключевой фокус доклада — на оптимизации производительности и стоимости. Мы углубимся в гибридную модель использования LLM: большая модель для сложного планирования и рой малых, дообученных и быстрых моделей (SLM) для рутинных операций. Вы узнаете, как техники вроде RAG и оптимизация внутренних протоколов обмена данными могут сократить расходы на токены в разы, повышая скорость ответа системы.
На примере реального кейса из медицинской сферы продемонстрирую, как заставить агентов на разных языках (Go, Python, Java) эффективно взаимодействовать и как обеспечить строгие требования к безопасности.
Этот доклад — не теоретические рассуждения, а руководство для архитекторов и разработчиков, которые хотят перейти от экспериментов к созданию промышленных, надёжных и экономически эффективных мультиагентных систем. Вы получите готовые архитектурные паттерны для решения проблем масштабирования, производительности и отказоустойчивости в ваших AI-проектах.
Ведущий AI-архитектор, Raft