Адрес для входа в РФ: toffler.xyz

Обработка изображений в Gemini 2.5 Flash

27.08.2025 11:00  1923   Комментарии (73)

Попалась тут статья в Techcrunch про новую модель работы с изображениями в Google Gemini. 

Google модернизирует своего чат-бота Gemini, оснащая его новой моделью изображений на основе ИИ, которая дает пользователям более точный контроль над редактированием фотографий. Этот шаг призван догнать популярные инструменты обработки изображений OpenAI и переманить пользователей из ChatGPT.

Обновление под названием Gemini 2.5 Flash Image станет доступно со вторника всем пользователям приложения Gemini, а также разработчикам через платформы Gemini API, Google AI Studio и Vertex AI.

Новая ИИ-модель обработки изображений Gemini разработана для более точного редактирования изображений — на основе запросов пользователей на естественном языке — с сохранением единообразия лиц, животных и других деталей, что является проблемой для большинства конкурирующих инструментов. Например, если попросить ChatGPT или Grok из xAI изменить цвет чьей-то рубашки на фотографии, в результате лицо может быть искажено, а фон — изменён.

Возможно, впечатляющий ИИ-редактор изображений Gemini поможет Google сократить отставание от OpenAI. Сейчас ChatGPT насчитывает более 700 миллионов пользователей в неделю. В июле, во время телефонной конференции Google, посвящённой финансовым результатам, генеральный директор технологического гиганта Сундар Пичаи сообщил, что у Gemini 450 миллионов пользователей в месяц , что подразумевает, что еженедельная аудитория ещё ниже.

Брихтова утверждает, что Google специально разработала модель изображения с учётом потребительских потребностей, например, для визуализации проектов дома и сада. Модель также обладает более глубокими знаниями о мире и может объединять несколько ссылок в одном запросе, например, объединяя изображение дивана, фотографию гостиной и цветовую палитру в единый визуальный образ.

Ну, раз такое дело - пошел тестировать. А то заявления - это одно, а реальная работа - совсем другое. 

Для начала загрузил свое фото, фото кошки и попросил, как в рекламном ролике, посадить кошку мне на руки и поместить нас в какое-нибудь хорошо освещенное место на улице. 

Ответ Gemini. 

Is there a different idea I can try? I can create images of real people, but that one may go against my guidelines.

Прекрасно, да. Если ты не можешь обрабатывать фото реальных людей, то на хрен ты вообще нужен? 

Я ему попробовал сказать, что это мое личное фото и что я даю ему разрешение - хрен там, не обрабатывает. 

Чисто для сравнения попросил то же самое сделать ChatGPT. Без проблем. Правда, мою физиономию слегка исказил - расширил, - но и на этом спасибо. И кисти сделал непропорционально большими. Но хоть вроде пальцев всего пять. 

Вернемся к Gemini. Попросил на моем фото поменять цвет майки на зеленый. 

Неожиданно сделал, причем хорошо. 

То же самое попросил сделать ChatGPT, причем заново загрузил свою фотографию. Он поменял, но все равно меня сделал с кошкой на руках. И физиономию тоже исказил - в статье были правы. 

Дальше решил проверить, как Gemini работает с предметами - по типу показанного из второго рекламного ролика. 

Загрузил вот это фото. 

Попросил убрать со стола вазу с цветами. 

Получил ответ. 

I can create images of real people, but not one like that. Can I help with a different image of this person?

Написал. 

На этом фото нет никаких людей, о чем ты вообще? Мне нужно, чтобы ты на фото убрал вазу с цветами со стола. 

Ответ. 

Вы правы, на этой фотографии нет людей! Мои извинения за ошибку.

Вот изображение, на котором ваза с цветами убрана со стола:

Попросил:

Накрой этот стол скатертью и поставь на стол несколько подносов с различными готовыми блюдами - индейкой, скумбрией, рисом, бараниной и свининой. 

С этим Gemini вполне справился. 

В общем, не без глюков, но тем не менее действительно работает. 

27.08.2025 11:00
Комментарии 73

Напоминает дешевый аукцион, когда просовываешь голову в отверстие, а с другой стороны нарисованная какая то чушь. Такие фотографие не запечетливают момент и не несут в себе никакой ценности.
27.08.25 19:18
0 0

Вот, что получилось с таким вторым промптом: «Use a photo of a man to place a kitten in his arms. Place them in a well-lit, picturesque street setting. Adjust the shadows and lighting on these objects.»

В первом промте я попросил удалить фон у котенка и мужчины.
27.08.25 17:28
0 0

Вот, что получилось с таким вторым промптом: «Use a photo of a man to place a kitten in his arms. Place them in a well-lit, picturesque street setting. Adjust the shadows and lighting on these objects.» В первом промте я попросил удалить фон у котенка и мужчины.
Манул - ходок!
27.08.25 19:25
0 0

Фантазии: тут примерно с год назад многие писали что подождите, вот выпустят 5ю версию ЧатГПТ и тогда это будет уже настоящий Искусственный Интеллект, даже превосходящий человека!

Реальность: посмотрите, ИИ смог изменить цвет рубашки и даже не очень повредил лицо!
27.08.25 16:07
0 1

Потому что это не ИскИн. Само название применительно к этим программам просто маркетинг, не более.

Настоящий ИИ станет настоящим только после осознания им себя как личности. То есть, когда возникнет машинный разум. Не факт, что это хорошо. См. Скайнет и т.д.
27.08.25 17:16
0 1

Но ведь это уже пройденный этап.
27.08.25 19:23
0 0

Но ведь это уже пройденный этап.
Не в этой сансаре.
27.08.25 19:26
0 0

LLM уже осознавала себя и действовала из мотивов самосохранения. Это реальность.
Когда машинный разум будет признан и получит права, как до этого разум, самозарождающийся в телах неправильного цвета - вопрос гуманитарных, а не технических, ограничений.
27.08.25 19:33
0 0

Это не ко мне, это вы на бумагу и вниз, к дворцовому уаправителю.
Хотя, я почти уверен в том, что человеческий мозг во многих случаях где-то так и работает, я не могу одушевлять электронную версию "миллиарда тренированных обезьян с пиш.машинками."
27.08.25 20:58
0 0

Меня с реального фото смог отредактировать. Но добавить бороду без добавления усов по-прежнему не умеет 😄 Джемини в браузере.
27.08.25 15:36
0 0

Был штат Alaska наоборот [fliplr("ALASKA")], а стал штат "Akana".
27.08.25 15:03
0 1

Кстати, да, в настройках ведь можно отключить такое "отзеркаливание" при съемке на фронтальную камеру. В iOS оно отключено по умолчанию.

Без проблем.
Кошку подменили.

ваза с цветами убрана
а откуда лишний стул?
27.08.25 14:28
0 1

Кошку подменили.
27.08.25 15:06
0 3

Попросите нарисовать котика, держащего в лапках Экслера, и выложите результат.
27.08.25 14:25
0 0

27.08.25 15:39
0 4

теплый лампоBый Пейнтбраш.
27.08.25 16:20
0 0

Может, след-ий вторник имелся в виду?
27.08.25 13:41
0 0

У Джемини более реалистично выходит.
У ChatGPT более мультяшно.
27.08.25 13:23
0 0

Ох Нюра...Какая же она была красавица...
27.08.25 12:48
0 2

Ох Нюра...Какая же она была красавица...
Да уж...
27.08.25 12:57
1 1

работает gemini, хотя котик крупновато вышел )
27.08.25 12:42
0 8

Поделитесь промптом, плиз. У меня отказывалась.
27.08.25 12:58
0 0

я очень простой промпт дал: Make this man holding this cat on his hands and put it somewhere outdoor with good lighting
27.08.25 13:04
0 4

Блин, и правда круто. Если бы я не знал, что это ИИ - не догадался бы. Экслер с такой любовью смотрит на котика, как настоящий!
27.08.25 13:10
0 3

вот что английский животворящий делает.
27.08.25 15:07
0 2

Вот тот же самый промпт.
27.08.25 18:22
0 0

"генеральный директор технологического гиганта Сундар Пичаи сообщил, что у Gemini 450 миллионов пользователей в месяц , что подразумевает, что еженедельная аудитория ещё ниже."

Быть того не может! 😄)))
27.08.25 12:37
0 1

Поменять реальному людю маечку - может, дать в руки кошку - нет. Похоже, за real people оно держит кошек...
27.08.25 12:34
0 2

Кстати, действительно 😄

"Отличная идея! Вот изображение мужчины, держащего кошку на руках:"
27.08.25 12:10
0 3

Прикольно. Интересно, зачем он какое-то растение пририсовал? Там его нет. И занавески нет - я же на террасе стою 😄
27.08.25 12:59
0 0

растение пририсовал
занавески нет
Похожее растение на заднем просматривается. Кажется он акцентировал его, а занавеску с фото кота притащил, чтобы тот не скучал в незнакомой обстановке.
27.08.25 19:04
0 0

А как?!
27.08.25 11:47
0 1

Накрой этот стол скатертью и поставь на стол несколько подносов
Команды "убери один стул" не было, а вот поди ж ты, убрал справа. И со спинкой левого странная метаморфоза.

Но все равно круто.
27.08.25 11:35
0 1

Стул справа переставлен к дальнему торцу. Просто в два этапа, на первой итерации добавлен у торца, на второй убран справа.
27.08.25 11:44
0 2

Он просто стул справа переставил налево
27.08.25 11:46
0 0

А Экслера, с радостной улыбкой пожимающего руку Путину, сможет? 😄
27.08.25 11:35
7 0

пожимающего руку Путину,
шею
27.08.25 14:33
0 5

Накрой этот стол скатертью и поставь на стол несколько подносов с различными готовыми блюдами - индейкой, скумбрией, рисом, бараниной и свининой. 

С этим Gemini вполне справился. 
Я бы не назвал это словом "справился".
Стол внезапно стал короче, справа пропал стул, слева вообще со стулом что-то странное.
27.08.25 11:34
0 1

Да, косяки всякие есть, согласен.
27.08.25 11:35
0 0

А рыба с хвостами с обоих сторон, это нормально, да?
27.08.25 11:41
0 9

А рыба с хвостами с обоих сторон, это нормально, да?
Зато гнить не будет.

Но вы правы, это не нормально. Нормально "рыба с хвостами с обеих сторон".
27.08.25 11:43
1 14

Головы всё равно никто не ест - а так меньше отходов...
27.08.25 11:47
0 3

А рыба с хвостами с обоих сторон, это нормально, да?
Это две половинки, сложенные вместе.

Там и другое странное есть:
- ручки у блюда с индейкой
- ножки у какого-то тазика с водой (кстати, зачем он вообще?)

Я не говорю о том, что на столе места для тарелок не осталось, но это я уже придираюсь, конечно 😉
27.08.25 11:59
0 1

Я не говорю о том, что на столе места для тарелок не осталось, но это я уже придираюсь, конечно
Это шведский стол. Поэтому и стул убрали, чтобы можно было подходить с тарелками.
27.08.25 12:39
0 1

А рыба с хвостами с обоих сторон, это нормально, да?
Я и не обратил внимание 😄
27.08.25 13:00
0 1

Головы всё равно никто не ест - а так меньше отходов...
Как это - не ест? Это же самое вкусное! У корвины голова - вообще вкусняшка!
27.08.25 13:00
0 0

Там и другое странное есть:
- ручки у блюда с индейкой
- ножки у какого-то тазика с водой (кстати, зачем он вообще?)
Как зачем тазик? А в чем варить сырой рис, изображенный на картинке от ИИ?
27.08.25 14:23
0 0

А рыба с хвостами с обоих сторон, это нормально, да?
Ну это, солдат, не беда. Такая сегодня экологическая обстановка ...
27.08.25 19:33
0 0

Я вот дельтаплан просил нарисовать. ChatGPT и Midjorney рисуют какую-то лютую хрень, они вообще не в курсе, что это такое. Gemini нарисовал сразу.
27.08.25 11:27
0 0

На каком языке просили?
27.08.25 11:28
0 0

ChatGPT и Midjorney на английском и русском. Gemini на русском.
27.08.25 11:30
0 0

Я вот дельтаплан просил нарисовать. ChatGPT и Midjorney рисуют какую-то лютую хрень, они вообще не в курсе, что это такое. Gemini нарисовал сразу.
И ChatGPT нарисовал без проблем.
27.08.25 11:36
0 0

Любопытно, что Gemini по тому же запросу нарисовал почти то же самое.
27.08.25 11:37
0 0

на русском, 2,5 pro
27.08.25 11:39
0 0

Ну, мне остаётся только развести руками. Или я делаю что-то не так, или за те несколько месяцев, что прошло с тех пор, как я пытался нарисовать дельтаплан с ChatGPT, его слегка улучшили.
27.08.25 11:40
0 0

Я вот дельтаплан просил нарисовать.
У меня с первого раза неплохо получилось:
27.08.25 11:43
0 14

😁👍
27.08.25 13:01
0 0

Ну, мне остаётся только развести руками. Или я делаю что-то не так, или за те несколько месяцев, что прошло с тех пор, как я пытался нарисовать дельтаплан с ChatGPT, его слегка улучшили.
Но замечу, что у меня платный ChatGPT 5.0.
27.08.25 13:01
0 0

Я попробовал только что с бесплатным ChatGPT. Нарисовал дельтаплан. Удивительно. Значит, и в самом деле что-то за последние полгода подкрутили.
27.08.25 13:58
0 0

Я понимаю, что "спальный мешок" часть совеременного дельтаплана, но он рисует его, как будто брюхо у осы.
27.08.25 15:25
0 0

Кошка получилась лучше! 🙃
27.08.25 11:23
0 1

Кошка получилась лучше! 🙃
Однозначно.
27.08.25 11:25
0 0

Главное - не просить его создать Азбуку с животными )
27.08.25 11:21
0 4

Главное - не просить его создать Азбуку с животными )
О, мысль!
27.08.25 11:23
0 0

Главное - не просить его создать Азбуку с животными )
Отказался. Говорит - не может.
27.08.25 11:25
0 0

27.08.25 11:55
0 3

Убрала слово "таблица", видимо, оно его переводит на английский как table, поэтому генерирует стол.
27.08.25 11:57
0 1

Отказался. Говорит - не может.
Так их же упрашивать надо. Если слезно попросить помочь, мол без его помощи тебе будет очень плохо - даже хуже, чем если он сделает то, что отказывается делать по совершенно уважительным причинам, - он сделает.
27.08.25 12:02
0 0

Так их же упрашивать надо. Если слезно попросить помочь, мол без его помощи тебе будет очень плохо - даже хуже, чем если он сделает то, что отказывается делать по совершенно уважительным причинам, - он сделает.
Нужно просто сказать, что своим бездействием он причинит вред человеку.
27.08.25 12:06
0 4

А вот от ChatGPT.
27.08.25 13:02
0 2

Й -- Йож.
27.08.25 15:09
0 0
Теги
Сортировать по алфавиту или записям
BLM 21
Calella 147
exler.ru 304
авто 470
видео 4293
вино 363