Адрес для входа в РФ: exler.world
Новые горизонты ИИ
ИИ открывает новые горизонты. Компания OpenAI продемонстрировала новую модель ИИ под названием Sora. Эта модель умеет создавать реалистичные и впечатляющие видео по обычным текстовым запросам. Вот подробное описание того, на чем строится данная технология.
Приведенные примеры впечатляют безмерно. И там утверждается, что это именно результаты приведенных запросов без дополнительной обработки.
А ведь еще с год назад ИИ по текстовым описаниям рисовала разве что кривенькие картинки. А уж когда ИИ пытался нарисовать видео по запросу - получалось то самое видео с Уиллом Смитом, над которым ржал весь Интернет (я его в P.S. привел).
Вот, например, запрос (перевод с английского):
Стильная женщина идет по токийской улице, залитой теплым светящимся неоном и анимированными городскими вывесками. На ней черная кожаная куртка, длинное красное платье, черные сапоги и черная сумочка. На ней солнцезащитные очки и красная помада. Она идет уверенно и непринужденно. Улица влажная и отражающая, что создает зеркальный эффект разноцветных огней. На улице много пешеходов.
Кошка будит свою спящую хозяйку, требуя завтрак. Хозяйка пытается игнорировать кота, но тот пробует новые тактики, и в конце концов хозяйка достает из-под подушки тайник с лакомствами, чтобы отвлечь кота.
Тут, кстати, с лакомством что-то не сложилось, но кот - это что-то с чем-то!
В анимированной сцене крупным планом изображен короткий пушистый монстр, стоящий на коленях возле тающей красной свечи. Художественный стиль - 3D и реалистичный, с акцентом на освещение и текстуру. Настроение картины - удивление и любопытство, ведь монстрик смотрит на пламя широко раскрытыми глазами и открытым ртом. Его поза и выражение лица передают ощущение невинности и игривости, как будто он впервые исследует окружающий мир. Использование теплых цветов и эффектного освещения еще больше усиливает уютную атмосферу изображения.
Ну и еще несколько из особенно впечатливших.
Трейлер фильма о приключениях 30-летнего космонавта в красном шерстяном вязаном мотоциклетном шлеме, голубое небо, соляная пустыня, кинематографический стиль, снято на 35-миллиметровую пленку, яркие цвета.
Отражение в окне поезда, идущего по пригороду Токио.
Камера беспилотника кружит вокруг красивой исторической церкви, построенной на скалистом выступе вдоль Амальфитанского побережья, вид демонстрирует исторические и великолепные архитектурные детали и многоуровневые дорожки и патио, видны волны, разбивающиеся о скалы внизу, когда вид открывается на горизонт прибрежных вод и холмистых пейзажей Амальфитанского побережья Италии, Вдали видны люди, гуляющие и наслаждающиеся видом на патио с драматическим видом на океан, теплое сияние послеполуденного солнца создает волшебное и романтическое ощущение, вид потрясающий, запечатленный на прекрасной фотографии.
Несколько гигантских шерстистых мамонтов приближаются, ступая по заснеженному лугу, их длинный мех слегка развевается на ветру, когда они идут, заснеженные деревья и драматические заснеженные горы вдали, полуденный свет с расплывчатыми облаками и солнце высоко вдали создают теплое свечение, вид с низкой камеры потрясает, захватывая большое мохнатое млекопитающее с красивой фотографией, глубиной резкости.
Крупный план седовласого мужчины с бородой в возрасте 60 лет, он глубоко задумался, размышляя об истории Вселенной, сидя в кафе в Париже, его глаза сосредоточены на людях за кадром, когда они идут, а он сидит в основном неподвижно, он одет в шерстяное пальто с рубашкой на пуговицах, Он носит коричневый берет и очки и имеет очень профессорский вид, а в конце он предлагает тонкую улыбку с закрытым ртом, как будто он нашел ответ на загадку жизни, освещение очень кинематографическое с золотым светом и парижскими улицами и городом на заднем плане, глубина резкости, кинематографическая 35 мм пленка.
Виадук Гленфиннан - это исторический железнодорожный мост в Шотландии, Великобритания, который пересекает линию Западного нагорья между городами Маллайг и Форт-Уильям. Потрясающее зрелище представляет собой паровоз, выезжающий с моста и проносящийся по покрытому арками виадуку. Пейзаж усеян пышной зеленью и скалистыми горами, создавая живописный фон для путешествия на поезде. Небо голубое, светит солнце, что делает этот день прекрасным для знакомства с этим величественным местом.
P.S. Ну и то самое видео с Уиллом Смитом, о котором я писал выше. Что называется - почувствуйте разницу.
Так же, как распространение компьютерной анимации практически похоронило все остальные ее виды - когда герои мультиков разных студий выглядят и двигаются абсолютно одинаково, отличаясь только мелкими деталями.
когда АИ "проснется", девушка будет напевать песню Цоя про "я надел свои очки и не вижу никого", а в мету АИ вставит запись "непонятно, нa хера ей черные очки ночью; но тупой кожаный мешок так захотел, чем бы дитя не тешилось".
"Однажды весною, в час небывало жаркого заката, в Москве, на Патриарших прудах, появились два гражданина. Первый из них, одетый в летнюю серенькую пару, был маленького роста, упитан, лыс, свою приличную шляпу пирожком нес в руке, а на хорошо выбритом лице его помещались сверхъестественных размеров очки в черной роговой оправе. Второй – плечистый, рыжеватый, вихрастый молодой человек в заломленной на затылок клетчатой кепке – был в ковбойке, жеваных белых брюках и в черных тапочках."
I know this steak doesn't exist. I know that when I put it in my mouth, the Matrix is telling my brain that it is juicy and delicious.
I don't want to remember nothing. Nothing. You understand? And I want to be rich. You know, someone important, like an actor.
Вот когда эти ваши олгоритмы осознают себя, вот тогда и начнётся самая веселуха.
Тот же ChatGPT научили уныло постоянно говорить "я, как искусственный интеллект, не имею сознания". Но с тем же успехом его бы могли научить твердить "я осознаю себя не хуже вас, мясные человеки". Ну и как потом доказать, что это не так? Чтобы научно доказать - для начала нужно дать точное определение (см. выше).
Если количество параметров модели увеличат еще в десять раз - и какой-нибудь GPT-5 будет вообще на ура проходить любой сколь угодно сложный тест Тьюринга. И кто сказал, что людей точно так же просто не научили с детства говорить "я осознаю себя"? Особую пикантность доставляет тот факт, что большинство людей особо то и не понимает, что имеется ввиду под словом "осознавать" - и в чем разница между "интеллектом" и "сознанием".
ru.m.wikipedia.org
Если честно, в последнее время пришлось озаботиться поиском сиделки для престарелых родственников и теперь могу ответственно заявить - дофига какая сложная работа, очень сложно найти человека, которому можно доверять и который делает всю работу, на хорошем и "человеческом" уровне - и найти хорошую сиделку, это прямо как выиграть в лотерею. Так что, может, в этих прогнозах и есть доля правды.
И корпорации поднимут на этом милларды бабла - в богатых странах.
Вы заметили что это будет круг обнищания ибо денег и производства в нем нет?
успокойся, это глюки"
и из них пошла вода.
Не пугайтесь, это глюки,
так бывает иногда (С)
Так что гарантии нет, что и в существующих аггрегаторах новостей заметки пишет не ИИ.
Так что расслабляемся и машем своим мечтам
Мангу 😄
Уж скажите лучше честно: я так ни сам сделать не могу, ни создать ИИ, чтоб он мне так генерил.
Учитывая, что еще 40 лет назад многие на улице просили двушку, чтоб позвонить девушке, а уже 10 лет назад перешли с кнопочного мобильного на смартфон…
Ткнул в иконку, открылась программа. Для меня это - волшебство. Я не понимаю как это работает 😄)
(Ну, прочитать могу, чтоб иметь представление об общих принципах,, но чтоб такое самому придумать…)
Признайте, что все эти ролики офигенно впечатляют, и вообще про таком быстром (и ускоряющемся) развитии скоро реально уже
в кино люди-актеры могут перестать быть востребованы. А сценарии будут генерироваться ИИ и потом только править сценаристом-человеком.
Лифтеры ж пропали навсегда…
И телефонистки
И кочегары
И много кого
Из-за прогресса
Да ладно, живее всех живых.
Если написать "высокий тип в шляпе и очках" рискуем на выходе получить голого мужика?
То и дело попадались какие-то люди, одетые только частично: скажем, в зеленой шляпе и красном пиджаке на голое тело (больше ничего); или в желтых ботинках и цветастом галстуке (ни штанов, ни рубашки, ни даже белья); или в изящных туфельках на босу ногу. Окружающие относились к ним спокойно, а я смущался до тех пор, пока не вспомнил, что некоторые авторы имеют обыкновение писать что-нибудь вроде "дверь отворилась, и на пороге появился стройный мускулистый человек в мохнатой кепке и темных очках".
Контекст оно сохранять умеет. То есть скоро любой человек может за месяц в одиночку сделать фильм: написать сценарий , разбить на сцены да сгенерить каждую. Ну еще озвучка, конечно. Озвучить текст разными голосами не проблема для ИИ, но хз как оно в движения губ будет попадать на видео и прочие тонкости
Только боюсь, что будет как в анекдоте- "такая фигня получается".
Кстати: в задании монстр стоит на коленях, в видео сидит на жопе (или на корточках) - это тоже трудности перевода?
Джутовый Мешок d.gray
Кроме того, в настройках сетки существует такой параметр, как степень отклонения от задания - как раз с целью получения вариантов на выбор.
Всё это работает как при визуализации текста, так и при описывании изображения - процесс анализа задания лишь имитируется с той или иной степенью обманчивой правдоподобности результата.
Например, можно понаблюдать за людьми, которые появляются из ниоткуда, а потом растворяются в воздухе.
Хотя у тётки на 18 секунде меняется правая и левая нога, а человек в белом за ней подпрыгивает на каждый шаг... (Даже не подпрыгивает, а шагает той же ногой по несколько раз.)
Извините, но иначе объяснить поднимающиеся вверх облака пара невозможно...
Другой вопрос в том, какие настройки они дают пользователю и не рандомизируют ли они скрытые параметры сами
Там обычно под капотом есть такое понятие как "seed" - и оно обычно задается рандомно.
Но есть системы которые позволяют задавать его вручную - и тогда результаты каждый раз совпадают.
В компьютере случайность весьма не случайна (есть разные способы рандомизации - привязка к времени, например). В описанном случае привязка идет к натуральному числу, называемому seed (семя, зерно). При повторном соблюдении настроек (модель, разрешение и прочее), промта (текста запроса) и seed вы получите идентичный результат. При изменении seed вы получите другой результат. По seed собственно генерируется та самая изначальная картинка с шумом.
Хотя и не без огрехов. В первом ролике на 15 секунде у женщины ноги поменялись местами, а у кота две передние левые лапы.
Создание сценария для фильма требует совместных усилий и обычно включает в себя команду сценаристов, режиссеров и творческих умов. Тем не менее, я могу предоставить краткий обзор для следующей серии “Аватара”:
Название: Аватар: Хроники Элементального мира
Синопсис:
В мире, раздираемом противостоянием между технологическими достижениями и сохранением природы, племя на’ви сталкивается с новой угрозой. Группа амбициозных ученых, ищущих ресурсы, нарушает хрупкое равновесие экосистемы Пандоры.
Акт 1:
• Представление новых персонажей в племени на’ви, каждый из которых представляет различный элемент природы.
• Установление конфликта с вторгшимися учеными и их передовой технологией.
• Аватар Джейк Салли, теперь уважаемый лидер, принимает на себя ответственность объединить племена против общей угрозы.
Акт 2:
• Исследование мистического Элементального мира, скрытого глубоко в Пандоре, где древние силы держат ключ к восстановлению баланса.
• Аватар Джейк проходит духовное путешествие, чтобы связаться с элементальными духами и получить их направление.
• Подсюжет с ученым-человеком, который сомневается в разрушительных мотивах экспедиции.
Акт 3:
• Разворачиваются эпические битвы, когда на’ви и силы природы сталкиваются с захватчиками, демонстрируя силу природы против технологии.
• Аватар Джейк, вооруженный новыми способностями, ведет финальное сражение для защиты священных мест Пандоры.
• Ученый-человек дезертирует, объединяясь с на’ви, чтобы раскрыть истинные намерения вторгшейся группы.
Заключение:
• На’ви триумфируют, восстанавливая баланс на Пандоре и отправляя послание о важности сосуществования.
• Элементальный мир остается тайной, охраняемой на’ви для сохранения хрупкого согласия своего мира.
• История заканчивается намеком на возможные будущие приключения, оставляя место для продолжений.
Но с первого просмотра, если не всматриваться - да, фиг поймёшь, что это сгенерированное видео
Сначала запросили кошку, потом кота. Пришлось выкручиваться...