
Александр Капитанов
Head of R&D Multimodal GigaChat, Sber AI
Парк культуры
MALVINA — система мультимодального редактирования изображений, позволяющая вносить локальные изменения по текстовым инструкциям без полной генерации сцены. В отличие от традиционных подходов, MALVINA обеспечивает точечную (pixelwise) модификацию целевых областей, сохраняя окружающий визуальный контекст. Благодаря совмещению визуальных и языковых признаков, система точно интерпретирует текстовые команды и производит структурно согласованные и семантически осмысленные изменения, не требующие дополнительной ручной коррекции.
Head of R&D Multimodal GigaChat, Sber AI