Apple совместно с Калифорнийским университетом выпустила нейросеть под названием MGIE (MLLM-Guided Image Editing). Она предназначена для редактирования фотографий по текстовому запросу и уже доступна исследователям машинного обучения Hugging Face.
Нейросеть написана в мультимодальном режиме и способна как понимать текстовые запросы пользователей на английском языке, так и распознавать объекты на изображениях. Среди базовых функции ИИ: увеличение или уменьшение кадра, редактирование контрастности, яркости и других элементов на фото.
Пример работы MGIE — у ИИ попросили сделать небо более красноватым
Фото: 9to5mac
Кроме того, MGIE может добавлять объекты или удалять их, менять цвет определённых деталей, применять различные фильтры и многое другое. Apple пока не комментировала выпуск модели — вполне возможно, в будущем ИИ станет одной из базовых функций в гаджетах компании.