Google расширяет функциональность своего чат-бота Gemini, добавив инструмент редактирования изображений. Теперь пользователи могут изменять как изображения, сгенерированные искусственным интеллектом, так и фотографии, загруженные с мобильных устройств или компьютеров.
Как сообщает Zanoza со ссылкой на «Lifehacker», ранее эта функция была доступна только в среде Google AI Studio, однако теперь её постепенно внедряют и в основное приложение Gemini. Новый инструмент поддерживает 45 языков и позволяет редактировать изображения при помощи обычных текстовых запросов. Пользователь может просто описать, что нужно изменить и ИИ выполнит задание.
Что теперь умеет Gemini?
С помощью Gemini можно:
- изменять или заменять отдельные элементы на фото;
- менять фон;
- добавлять новые объекты и детали, даже если их изначально не было.
К примеру, в блоге Google демонстрируют, как можно загрузить своё фото и попросить ИИ изменить цвет волос — это поможет, например, визуально примерить новый образ до похода в салон.
Кроме того, Gemini запоминает предыдущие действия, что позволяет пошагово корректировать одно и то же изображение. Также можно использовать эту функцию для создания визуальных историй, иллюстраций и креативных проектов.
Что с безопасностью и ограничениями?
Разумеется, такие технологии вызывают обеспокоенность в связи с возможным созданием фейков. В связи с этим Google заявила, что на все изображения, сгенерированные ИИ, будут наноситься скрытые цифровые водяные знаки. Также компания экспериментирует с видимыми метками, чтобы облегчить распознавание ИИ-контента.
Пока новая функция запускается поэтапно, поэтому она может быть недоступна сразу для всех. Более того, редактирование изображений пока не поддерживается для пользователей корпоративных и образовательных аккаунтов Google Workspace.
Напомним, ранее мы рассказывали о пяти книгах, которые помогут переосмыслить будущее и искусственный интеллект.