Адрес для входа в РФ: exler.world
Журнал Time публикует ежегодный список 100 самых влиятельных людей в области искусственного интеллекта.
Выпуск TIME100 AI 2024 года представляет собой обложку с фотоиллюстрацией Клаве Ржечи для TIME, на которой изображены 18 участников списка, включая Лизу Су из AMD, Стива Хаффмана из Reddit, Артура Менша из Mistral AI, Дженсена Хуанга из NVIDIA, Амбу Кака из AI Now Institute, актрису Скарлетт Йоханссон и других представителей нового списка.
То есть актрису Скарлетт Йоханссон, как самую влиятельную в области AI, они не забыли поместить на обложку. А Сэма Альтмана, основателя OpenAI, они на обложку не поместили. Слушайте, ну правда - кто такой Сэм Альтман для искусственного интеллекта по сравнению со Скарлетт Йоханссон, которая сыграла искусственный интеллект в поразительно дурацком фильме "Она"? Но в список 100 влиятельных людей Альтман все-таки попал, врать не буду. Только обложки не удостоился.
В ТГ "Джимми Нейрон" - русская литературная классика в стиле Pixar (я бы даже сказал - по стилю ближе к Disney, а не к Pixar). Как пишет сам автор, это сделано с помощью Dalle-3 + много "Фотошопа".
А прикольно получилось, как я считаю.
Попалась ссылочка на ИИ LumaLabs, который "оживляет" фотографии - делает из них кусочек видео.
Потестировал. Когда модели просто скармливаешь фото, и она его "оживляет" по своему усмотрению - получается очень по-разному. Иногда прям хорошо. Иногда очень так себе. Реже - прям совсем ужас-ужас. Но там в запросе можно указывать, что именно вы хотите получить, и это можно влиять на результаты.
Ну и вот что у меня получилось. (Я уточняющие запросы не делал, просто смотрел, как она обработает.)
Оригинал фото из 1986 года (значит, мне было ровно 20).
Обработка. Прикольно получилось.
Наша компания перед каким-то MWC в Барселоне.
Фирменную плющевскую ухмылку модель обработать не смогла, а вот нас с Пашей Кушелевым обработала прикольно.
Фото неизвестного испанца XXI века.
Обработка. Ну так, прикольно, хотя черты лица заметно исказила.
Еще фото.
Вот тут уже дурдом полный. Но оно и понятно: хуже всего получается, когда модель начинает изображать какие-нибудь заметные движения. В данном случае у Сакмарова флейта располовинилась.
Ну и еще вот эту фоточку модели подсунул.
В видео я, судя по всему, что-то кому-то горячо доказываю: понять бы что именно.
Поиграйтесь, там бесплатно можно 25 изображений обработать. Подождать придется, но это не страшно.
Что искусственный интеллект-то вытворяет! Мало того, что озвучивает на других языках, но при этом еще и сохраняет оригинальные голоса актёров, фантастика!
Проверял тут одну штуку. Попросил четыре разных ИИ нарисовать группу довольных мужчин, безо всяких уточнений.
Stable Diffusion, реалистичная модель.
DALL-E в ChatGPT.
Плагин Image Edit and img2img в ChatGPT.
DALL-E в CoPylot. Единственный, кто добавил атмосферу праздника.
Ну и вот статья со сравнением результатов рисования по разным промптам четырех AI: Stable Diffusion, Midjourney, DALL-E vivid и DALL-E natural.
OpenAI представила модель GPT-4o, которая умеет полноценно общаться человеческим голосом: интонации, смех, запинки и так далее.
Вот демонстрация. Впечатляет, да.
Upd: И еще одна демонстрация - эта модель используется для перевода с английского на испанский и обратно.
Компания Microsoft представила модель искусственного интеллекта VASA-1, предназначенную для генерирования реалистичных видео персонажей, произносящих заданный текст, по одной фотографии и аудиоклипу с речью. VASA-1, способна не только воспроизводить движения губ, синхронизированные со звуком, но и улавливать широкий спектр нюансов лица и естественных движений головы, которые способствуют реалистичному восприятию.
Пишут, что эта модель поддерживает онлайн-генерацию видео 512x512 с частотой до 40 кадров в секунду с незначительной задержкой.
Для чего это может применяться? Ну, например, для создания реалистичных аватаров, которые имитируют человеческий разговор.
На странице проекта выложено множество примеров работы VASA-1, вот один из них.
Ну и вот ролик, который показывает, как работает эта технология в реальном времени.
Попалась тут ссылка на нейросеть для реставрации и раскрашивания старых фото. Работает в онлайне, бесплатная.
Погонял на всяких произвольных старых фото. Ну, в принципе, работает вполне неплохо. Никак не идеально, но неплохо. А до нужного вида потом можно в "Фотошопе" довести.
Следы невиданных зверей!
Don Allen Stevenson III в содружестве с OpenAI и моделью Sora создал демонстрационный ролик о несуществующих животных.
Вот что он пишет в описании (оригинал на английском).
Я очень рад представить нечто поистине революционное в сотрудничестве с @openai - взгляд в будущее повествования с помощью технологии Sora. 🌟
В этом трейлере мы исследуем параллельный мир за пределами нашей реальности, где границы воображения расширяются, оживляя несколько существ, которых я придумал. То, что вы видите, - это не традиционные кадры 🎞️, а результат работы новейшей видеотехнологии, созданной искусственным интеллектом, которая стирает границы между реальностью и фантазией. Я попытался заложить в основу своих работ что-то знакомое, например, животных, но также и то, что в настоящее время невозможно с точки зрения биологии, 🧬 эти гибридные существа.
Сейчас, когда мы вступаем в новую эру, я понимаю опасения, связанные с быстрой эволюцией наших творческих индустрий. Я действительно считаю, что Sora предлагает другой вид визуального холста, расширяя мои творческие возможности и дополняя мои различные творческие ремесла. Я всегда был творческой студией, состоящей из одного человека, поэтому существовали ограничения на то, что я мог создать в одиночку. С Sora я чувствую, что могу рассказывать истории в таких масштабах, которые раньше мне казались невозможными.
Продолжая быть ранним художником, работающим с Sora, я обещаю помнить о ее глубоком влиянии. Я буду продолжать делиться знаниями о ней в образовательном и творческом качестве.
Я чувствую, что мы открываем 🔓 новую эру творческого повествования, которую мы никогда раньше не могли представить коллективно! Оставайтесь любопытными и творческими!!!
Ну и вот сам ролик, который некоторым образом взрывает мозг...