Адрес для входа в РФ: exler.world

БЛОГ

Новые горизонты ИИ

16.02.2024 10:00 13114 Комментарии (110)

ИИ открывает новые горизонты. Компания OpenAI продемонстрировала новую модель ИИ под названием Sora. Эта модель умеет создавать реалистичные и впечатляющие видео по обычным текстовым запросам. Вот подробное описание того, на чем строится данная технология.

Приведенные примеры впечатляют безмерно. И там утверждается, что это именно результаты приведенных запросов без дополнительной обработки.

А ведь еще с год назад ИИ по текстовым описаниям рисовала разве что кривенькие картинки. А уж когда ИИ пытался нарисовать видео по запросу - получалось то самое видео с Уиллом Смитом, над которым ржал весь Интернет (я его в P.S. привел).

Вот, например, запрос (перевод с английского):

Стильная женщина идет по токийской улице, залитой теплым светящимся неоном и анимированными городскими вывесками. На ней черная кожаная куртка, длинное красное платье, черные сапоги и черная сумочка. На ней солнцезащитные очки и красная помада. Она идет уверенно и непринужденно. Улица влажная и отражающая, что создает зеркальный эффект разноцветных огней. На улице много пешеходов.

Кошка будит свою спящую хозяйку, требуя завтрак. Хозяйка пытается игнорировать кота, но тот пробует новые тактики, и в конце концов хозяйка достает из-под подушки тайник с лакомствами, чтобы отвлечь кота.

Тут, кстати, с лакомством что-то не сложилось, но кот - это что-то с чем-то!

В анимированной сцене крупным планом изображен короткий пушистый монстр, стоящий на коленях возле тающей красной свечи. Художественный стиль - 3D и реалистичный, с акцентом на освещение и текстуру. Настроение картины - удивление и любопытство, ведь монстрик смотрит на пламя широко раскрытыми глазами и открытым ртом. Его поза и выражение лица передают ощущение невинности и игривости, как будто он впервые исследует окружающий мир. Использование теплых цветов и эффектного освещения еще больше усиливает уютную атмосферу изображения.

Ну и еще несколько из особенно впечатливших.

Трейлер фильма о приключениях 30-летнего космонавта в красном шерстяном вязаном мотоциклетном шлеме, голубое небо, соляная пустыня, кинематографический стиль, снято на 35-миллиметровую пленку, яркие цвета.

Отражение в окне поезда, идущего по пригороду Токио.

Камера беспилотника кружит вокруг красивой исторической церкви, построенной на скалистом выступе вдоль Амальфитанского побережья, вид демонстрирует исторические и великолепные архитектурные детали и многоуровневые дорожки и патио, видны волны, разбивающиеся о скалы внизу, когда вид открывается на горизонт прибрежных вод и холмистых пейзажей Амальфитанского побережья Италии, Вдали видны люди, гуляющие и наслаждающиеся видом на патио с драматическим видом на океан, теплое сияние послеполуденного солнца создает волшебное и романтическое ощущение, вид потрясающий, запечатленный на прекрасной фотографии.

Несколько гигантских шерстистых мамонтов приближаются, ступая по заснеженному лугу, их длинный мех слегка развевается на ветру, когда они идут, заснеженные деревья и драматические заснеженные горы вдали, полуденный свет с расплывчатыми облаками и солнце высоко вдали создают теплое свечение, вид с низкой камеры потрясает, захватывая большое мохнатое млекопитающее с красивой фотографией, глубиной резкости.

Крупный план седовласого мужчины с бородой в возрасте 60 лет, он глубоко задумался, размышляя об истории Вселенной, сидя в кафе в Париже, его глаза сосредоточены на людях за кадром, когда они идут, а он сидит в основном неподвижно, он одет в шерстяное пальто с рубашкой на пуговицах, Он носит коричневый берет и очки и имеет очень профессорский вид, а в конце он предлагает тонкую улыбку с закрытым ртом, как будто он нашел ответ на загадку жизни, освещение очень кинематографическое с золотым светом и парижскими улицами и городом на заднем плане, глубина резкости, кинематографическая 35 мм пленка.

Виадук Гленфиннан - это исторический железнодорожный мост в Шотландии, Великобритания, который пересекает линию Западного нагорья между городами Маллайг и Форт-Уильям. Потрясающее зрелище представляет собой паровоз, выезжающий с моста и проносящийся по покрытому арками виадуку. Пейзаж усеян пышной зеленью и скалистыми горами, создавая живописный фон для путешествия на поезде. Небо голубое, светит солнце, что делает этот день прекрасным для знакомства с этим величественным местом.

P.S. Ну и то самое видео с Уиллом Смитом, о котором я писал выше. Что называется - почувствуйте разницу.

видео ИИ

16.02.2024 10:00

Предыдущая запись Следующая запись

Комментарии 110

Как бы не получилось, что распространение цифровых камер и сравнительно дешевого компьютерного монтажа дало возможность снимать авторское кино - а распространение генеративного AI-"лубка" его похоронит.
Так же, как распространение компьютерной анимации практически похоронило все остальные ее виды - когда герои мультиков разных студий выглядят и двигаются абсолютно одинаково, отличаясь только мелкими деталями.

Paskin

17.02.24 16:15

0 1

Тут народ скоро до сильного Аи доиграется сам того не заметив. По крайней мере такая вещь как смысл уже начала четко проявляться - даже судя по покоцаным кастрированным выходам…

alex_127

17.02.24 15:46

0 0

Нейронные сети третьей волны ИИ хорошо умеет в семантику, но еще не умеет в логику.

Martin

alex_127

17.02.24 19:21

0 0

На канале РБК задаются вопросом: не нанесет ли удар Sora современным производителям кино- и рекламного контента?

Martin

16.02.24 20:14

0 0

У кошки две левые передние лапы. А так ничего.

Mathemilda

16.02.24 19:54

0 2

Amazing!

Сэр Макс

16.02.24 17:02

0 0

Сэр, поможешь с естественным интеллектом? ИИ в поисковике не справился:

Если ты в Интернете нашёл - поделишься ссылкой на книжку Литтла, по которой снят сериал "Консультант"? Полную версию никак не разыщу...

Zmitrok

Сэр Макс

16.02.24 18:24

0 1

Тут, кстати, с лакомством что-то не сложилось...

У Гайдая так же ИИ с длиной руки Балбеса ошибался 😁

Zmitrok

16.02.24 17:00

0 8

>>>На ней солнцезащитные очки

когда АИ "проснется", девушка будет напевать песню Цоя про "я надел свои очки и не вижу никого", а в мету АИ вставит запись "непонятно, нa хера ей черные очки ночью; но тупой кожаный мешок так захотел, чем бы дитя не тешилось".

runcyclexcski

16.02.24 15:21

0 0

А если такое задать:

"Однажды весною, в час небывало жаркого заката, в Москве, на Патриарших прудах, появились два гражданина. Первый из них, одетый в летнюю серенькую пару, был маленького роста, упитан, лыс, свою приличную шляпу пирожком нес в руке, а на хорошо выбритом лице его помещались сверхъестественных размеров очки в черной роговой оправе. Второй – плечистый, рыжеватый, вихрастый молодой человек в заломленной на затылок клетчатой кепке – был в ковбойке, жеваных белых брюках и в черных тапочках."

gab

16.02.24 15:19

0 7

Пусть нарисует запрос:

I know this steak doesn't exist. I know that when I put it in my mouth, the Matrix is telling my brain that it is juicy and delicious.
I don't want to remember nothing. Nothing. You understand? And I want to be rich. You know, someone important, like an actor.

AnatoliD

16.02.24 15:16

0 0

Лучше вот это пусть нарисует:

Yesterday, upon the stair,
I met a man who wasn't there
He wasn't there again today
I wish, I wish he'd go away...

b_x20852

AnatoliD

16.02.24 22:23

0 0

Вот новость еще про ChatGPT: Айтишник Александр Жадан выбрал жену через Tinder с помощью ChatGPT.

«На разработку проекта ушло ~120 часов и $1432 на API. На счета в ресторанах вышло до 200 тысяч рублей. Тем не менее, затраты отбил и заработал на рекомендациях. Если знакомиться самому и ходить на свидания, то на то же самое ушло 5+ лет и 13+ миллионов рублей. Спасибо ChatGPT за экономию денег и времени», – завершил тред Жадан.

Martin

16.02.24 13:08

0 2

Не сомневаюсь, что ChatGPT прекрасно проявит себя в брачную ночь (да и во все последующие).

Solmir

Martin

16.02.24 13:41

0 4

Чувак так и светится от радости.

runcyclexcski

Solmir

16.02.24 15:23

0 4

В принципе, чувак может отбить вложенные бабки в API, предложив свой продукт агентствам и сайтам знакомств, чтобы те могли с помощью искусственного интеллекта помогать находить людям пару.

Martin

16.02.24 20:31

0 1

Не сомневаюсь, что ChatGPT прекрасно проявит себя в брачную ночь (да и во все последующие).

Правильно сформулировать предложение руки и сердца избраннице Александр Жадан тоже поручил искусственному интеллекту.

Martin

Solmir

16.02.24 20:32

0 0

Чувак так и светится от радости.

не последняя, чай.

xoxol

runcyclexcski

17.02.24 14:00

0 1

Не сомневаюсь, что ChatGPT прекрасно проявит себя в брачную ночь (да и во все последующие).

Ну, брачные ночи искусственному интеллекту мы не отдадим, а вот возможность работать вместо нас - с радостью (а зарплата чтобы все-таки шла нам - человекам). 😄

Martin

Solmir

18.02.24 16:03

0 0

В твиттере есть тред, где спец по нейронкам посчитал, что чтоб это все реализовать, потребовалась бы целая команда спецов и куча времени. Если ничего не путаю, то речь про этот кейс. Про другие я просто не слышал recently. Если сильно заморочиться, можно найти тот тред, я в телеге скрины читал

vanburg

Martin

17.03.24 08:56

0 0

"Вы и плюшки за меня есть будете?"(с)
Вот когда эти ваши олгоритмы осознают себя, вот тогда и начнётся самая веселуха.

Sergy_B

16.02.24 12:48

0 5

Еще бы кто научно описал разницу между: "осознавать себя" и "утверждать, что я осознаю себя" - и притом так, чтобы все согласились с определением 😉 Пока что это прерогатива лишь философов, вроде Дэвида Чалмерса.

Тот же ChatGPT научили уныло постоянно говорить "я, как искусственный интеллект, не имею сознания". Но с тем же успехом его бы могли научить твердить "я осознаю себя не хуже вас, мясные человеки". Ну и как потом доказать, что это не так? Чтобы научно доказать - для начала нужно дать точное определение (см. выше).

Если количество параметров модели увеличат еще в десять раз - и какой-нибудь GPT-5 будет вообще на ура проходить любой сколь угодно сложный тест Тьюринга. И кто сказал, что людей точно так же просто не научили с детства говорить "я осознаю себя"? Особую пикантность доставляет тот факт, что большинство людей особо то и не понимает, что имеется ввиду под словом "осознавать" - и в чем разница между "интеллектом" и "сознанием".

freeflyer777

Sergy_B

16.02.24 16:34

0 0

Особая пикантность в том, что у большинства людей самоосознанность отсутствует в принципе, и ничего, живут, работают, размножаются.

Nomad

freeflyer777

16.02.24 19:35

0 0

Вы мне напомнили про аргумент китайской комнаты:
ru.m.wikipedia.org

elijahwoo

freeflyer777

16.02.24 20:34

0 0

я осознаю себя не хуже вас, мясные человеки

b_x20852

freeflyer777

16.02.24 22:19

0 0

Недавно, у Шульман было о том, что профессии будущего, это скорее всего, не тяжелые физические работы на производстве, где людей могут заменить машины, не программисты, где их может заменить ИИ, а скажем, такие профессии, как сиделка или няня, которая ухаживает за больным/пожилым человеком/ребенком. Это работа, которую может делать только человек, заменить его тут пока никак невозможно, а пожилых людей, с увеличением продолжительности жизни, становится все больше.

Если честно, в последнее время пришлось озаботиться поиском сиделки для престарелых родственников и теперь могу ответственно заявить - дофига какая сложная работа, очень сложно найти человека, которому можно доверять и который делает всю работу, на хорошем и "человеческом" уровне - и найти хорошую сиделку, это прямо как выиграть в лотерею. Так что, может, в этих прогнозах и есть доля правды.

Serso

16.02.24 12:42

0 5

и теперь могу ответственно заявить - дофига какая сложная работа, очень сложно найти человека, которому можно доверять и который делает всю работу, на хорошем и "человеческом" уровне - и найти хорошую сиделку, это прямо как выиграть в лотерею.

Это означает: работа сиделки слишком сложна для обычного человека. Поэтому, хоть прямо сейчас сиделку ИИ заменить и не может, это хороший кандидат для того, что-бы на этом секторе тоже сосредоточились разработчики. Но это еще не прямо сейчас, конечно.

ihar

Serso

16.02.24 13:33

0 0

такие профессии, как сиделка или няня, которая ухаживает за больным

Это работа, которую может делать только человек

Так и про рисование тоже раньше думали, что "это может делать только человек".

Если честно, в последнее время пришлось озаботиться поиском сиделки

Вот я как раз думаю, что это и будет "next big thing" - настоящий домашний робот.
И корпорации поднимут на этом милларды бабла - в богатых странах.

freeflyer777

Serso

16.02.24 16:40

0 0

Недавно, у Шульман было о том, что профессии будущего, это скорее всего, не тяжелые физические

То есть сначала ты будешь няней, потом сиделкой, потом за тобой будет ухаживать сиделка.
Вы заметили что это будет круг обнищания ибо денег и производства в нем нет?

alex_127

Serso

17.02.24 15:35

0 0

Деньги - это долговые расписки. Если произойдёт глобальное перераспределение обязанностей, то и перераспределение ресурсов тоже произойдёт, хватит ли всем? Это не быстрый процесс, вроде бы. С др. стороны рост населения Земли вплоть до недавнего времени был просто чудовищным, буквально только что "притормозил":

Sergy_B

alex_127

17.02.24 22:08

0 0

Если вы идёте по улице и у убегающей от вас кошки вдруг временно появляется пятая нога, то теперь вы знаете, что кроме давно известных причин происходящего, теперь есть очень пикантная новая версия.

harpsnake

16.02.24 12:32

0 4

Если вы идёте по улице и у убегающей от вас кошки вдруг временно появляется пятая нога, то теперь вы знаете, что кроме давно известных причин...

"Если лезут из стенки руки
успокойся, это глюки"

ihar

harpsnake

16.02.24 13:34

0 0

"Если лезут из стенки рукиуспокойся, это глюки"

В потолке открылись люки
и из них пошла вода.
Не пугайтесь, это глюки,
так бывает иногда (С)

Vld_Sergio°

ihar

16.02.24 15:07

0 4

ФСИН ЯНАО сообщает, что Алексей Навальный умер после того, как потерял сознание на прогулке.

Daario Nahalis

16.02.24 12:27

1 8

Интересно, а когда уже сделают следующий шаг- чтоб ИИ создавала по запросу пользователя агрегаторы новостей типа сайта Экслера?

Regs

16.02.24 12:13

0 4

Скоро

Ilya__

Regs

16.02.24 12:30

0 0

чтоб ИИ создавала по запросу пользователя агрегаторы новостей типа сайта Экслера?

Я вас умоляю! Еще никому не удалось доказать, что Экслер - не ИИ!

ihar

Regs

16.02.24 13:35

0 0

Еще никому не удалось доказать, что Экслер - не ИИ!

Его вообще пять инстанций еще во времена MS-DOS было. А котов Бубликов и подавно не счесть.

TimeWaster

ihar

16.02.24 14:16

0 0

И не считали - они на вес идут, когда их много 😹

Zmitrok

TimeWaster

17.02.24 02:04

0 1

Думаю, что скормить чатгпт тех задание и получить на выходе статью уже сейчас проблемы нет.

Так что гарантии нет, что и в существующих аггрегаторах новостей заметки пишет не ИИ.

Kuros85

Regs

17.02.24 12:28

0 0

вот тут собрали на целых 13 минут.
t.me

ktibr

16.02.24 12:03

1 1

Когда эта технология дойдет до уровня удовлетворяющего киноиндустрию технические требования к компьютерам способным с этим работать смогут осилить только большие кинокомпании.
Так что расслабляемся и машем своим мечтам

bilbo

16.02.24 11:51

0 2

Краундфандинг? Например на экранизацию "Мастера и Маргариты".

Dmitry 777

bilbo

16.02.24 16:23

0 0

Только в этот раз мультфильм пусть снимут!

Zmitrok

Dmitry 777

17.02.24 02:00

0 2

Аниме.
Мангу 😄

xoxol

Zmitrok

17.02.24 13:59

0 1

Пятиногие кошки, исчезающие люди, нога на 18-й секунда поменялась…

Уж скажите лучше честно: я так ни сам сделать не могу, ни создать ИИ, чтоб он мне так генерил.

Учитывая, что еще 40 лет назад многие на улице просили двушку, чтоб позвонить девушке, а уже 10 лет назад перешли с кнопочного мобильного на смартфон…

Ткнул в иконку, открылась программа. Для меня это - волшебство. Я не понимаю как это работает 😄)
(Ну, прочитать могу, чтоб иметь представление об общих принципах,, но чтоб такое самому придумать…)

Признайте, что все эти ролики офигенно впечатляют, и вообще про таком быстром (и ускоряющемся) развитии скоро реально уже
в кино люди-актеры могут перестать быть востребованы. А сценарии будут генерироваться ИИ и потом только править сценаристом-человеком.
Лифтеры ж пропали навсегда…
И телефонистки
И кочегары
И много кого

Из-за прогресса

chingachgook

16.02.24 11:50

1 1

Лифтеры ж пропали навсегда…

И кочегары

Да ладно, живее всех живых. Просто изменились их обязанности.

Regs

chingachgook

16.02.24 11:59

0 1

И кочегары
Да ладно, живее всех живых.

Цой жыв!

runcyclexcski

Regs

16.02.24 16:34

0 2

Цой жыв!

да, действительно, с кочегарами я погорячился

chingachgook

runcyclexcski

16.02.24 18:24

0 0

Лифтеры ж пропали навсегда…И телефонистки И кочегары

Лифтёр сейчас - это тот, кто тебя из застрявшего лифта вызволит (и ещё та, которой ты жалуешься, что застрял); телефонистка - это та, кто "ответит тебе сразу, как только освободится"; а "оператор котельной" или "истопник" до сих пор в разделе "требуются" встречаются.

Zmitrok

chingachgook

16.02.24 21:10

0 0

К одному из членов штаба Бориса Надеждина в Казани Евгению Маркову пришли с обысками. Как считает, глава регионального штаба, это могли быть сотрудники из центра по противодействию экстремизму. Марков работал сборщиком подписей.

Daario Nahalis

16.02.24 11:48

6 1

Вам скучно с нами?

d.gray

Daario Nahalis

16.02.24 12:04

3 5

Стильная женщина идет по токийской улице

Неужели ИИ не умеет рисовать иероглифы? Да и латинские буквы в трейлере про космонавта тоже какие-то странноватые. ИМХО это должно быть проще всего остального.

FP-92

16.02.24 11:47

0 0

Не умеет. Примерно по тем же причинам, по которым не умеет рисовать повторяющиеся объекты и плохо умеет в общую композицию кадра: генеративные сети опираются на ближайшие корреляции (т.е. "имеет ли смысл такой кусочек рядом с этими кусочками"), а не на общую картину ("имеет ли смысл такой кусочек как детализация вот этого фрагмента полного изображения").

Abstraction

FP-92

16.02.24 12:45

0 0

Алекс как-то публиковал тут новость про иск художников к Midjourney за эксплуатацию их работ (картинки ИИ получились очень похожи на оригиналы). Думается, тут возникнет та же проблема, только топить это дело в судах будут всем Голливудом.

Raiker

16.02.24 11:43

0 0

Иск послали нафиг. Как и иск к чатгпт.

bilbo

Raiker

16.02.24 11:53

0 0

Думается, тут возникнет та же проблема

По ходу уже возникла. 😄 Чувак в скафандре и шапочке сильно напоминает кого-то из голливудских актеров.

d.gray

Raiker

16.02.24 12:03

0 1

Да ну?

xoxol

d.gray

16.02.24 15:39

0 1

Я так понимаю одежду персонажей придётся описывать полностью.
Если написать "высокий тип в шляпе и очках" рискуем на выходе получить голого мужика?

Юрий П

16.02.24 11:13

0 1

Смотря какой тренировочный набор. Скорее всего нет

bblu

Юрий П

16.02.24 11:14

0 0

Нет, потому что из всех картинок которые бы назвали "высокий тип в шляпе и очках" доля* картинок с мужиком только в шляпе и очках маленькая, большинство* картинок с таким описанием лишены обнажёнки.

Abstraction

Юрий П

16.02.24 12:48

0 0

Блокировка "ню" и еще ряда тем стоит.

Miller777

Юрий П

16.02.24 16:18

0 0

Если написать "высокий тип в шляпе и очках" рискуем на выходе получить голого мужика?

О такой проблеме ещё Стругацкие предупреждали:
То и дело попадались какие-то люди, одетые только частично: скажем, в зеленой шляпе и красном пиджаке на голое тело (больше ничего); или в желтых ботинках и цветастом галстуке (ни штанов, ни рубашки, ни даже белья); или в изящных туфельках на босу ногу. Окружающие относились к ним спокойно, а я смущался до тех пор, пока не вспомнил, что некоторые авторы имеют обыкновение писать что-нибудь вроде "дверь отворилась, и на пороге появился стройный мускулистый человек в мохнатой кепке и темных очках".

Zmitrok

Юрий П

16.02.24 17:10

0 2

Не без косяков, конечно, но очень впечатляет. Тут видео выглядит лучше чем 95% фильмов, скоро можно кино не снимать.
Контекст оно сохранять умеет. То есть скоро любой человек может за месяц в одиночку сделать фильм: написать сценарий , разбить на сцены да сгенерить каждую. Ну еще озвучка, конечно. Озвучить текст разными голосами не проблема для ИИ, но хз как оно в движения губ будет попадать на видео и прочие тонкости

_as_

16.02.24 11:02

0 1

Любой человек даже с помощью всех ИИ не сможет вообще ничего написать. А сценарий тем более. Потому что ИИ это не кнопка "шедевр". Чтобы нейросеть тебе нарисовала, написала, сочинила придется приложить много сил и умений в первую очередь сформулировать что ты хочешь. И да, запрос "напиши что я хочу" не работает.

bilbo

_as_

16.02.24 11:46

0 4

Тут видео выглядит лучше чем 95% фильмов, скоро можно кино не снимать.

Скоро можно будет так- даёшь задание ЧатГРТ написать сценарий, потом этот сценарий скармливаешь ВидеоГРТ и смотришь фильм.
Только боюсь, что будет как в анекдоте- "такая фигня получается".

Regs

_as_

16.02.24 11:49

0 3

Нууу... Так они пока только хвастаются. Пользоваться-то нельзя...

Jason

16.02.24 10:56

0 2

Ну то, что прогресс есть - это очевидно, странно было бы, если бы его не было. Но, я так понимаю, попробовать самому пока нельзя? Обычно, когда представляют такую технологию, генерятся сотни роликов из которых отбирают десяток самых эффектных и безкосячных. То есть все по прежнему - интересно, забавно, но на практике пока мало применимо.

d.gray

16.02.24 10:55

1 1

генерятся сотни роликов из которых отбирают десяток самых эффектных и безкосячных

...к которым придумывают описание, выдавая его за изначальное техзадание. Возможно, описание по видео генерит ИИ, так что, всё честно.

Алекс У

d.gray

16.02.24 11:05

0 1

Возможно, описание по видео генерит ИИ

Очень на то похоже, ведь монстрик смотрит на пламя широко раскрытыми глазами и открытым ртом.

Джутовый Мешок

Алекс У

16.02.24 11:26

0 0

Очень на то похоже, ведь монстрик смотрит на пламя широко раскрытыми глазами и открытым ртом.

По ходу трудности перевода GT. В оригинале:

as the monster gazes at the flame with wide eyes and open mouth

Мой английский далек от совершенства, но вроде бы все правильно.

d.gray

Джутовый Мешок

16.02.24 11:47

0 1

Ну так если GT, который тоже вроде бы ИИ, не в состоянии справиться со своей предельно формализованной задачей - фигли мы тут про пятиногих кошек?..
Кстати: в задании монстр стоит на коленях, в видео сидит на жопе (или на корточках) - это тоже трудности перевода?

Джутовый Мешок

d.gray

16.02.24 11:55

0 0

в задании монстр стоит на коленях, в видео сидит на жопе (или на корточках) - это тоже трудности перевода?
Джутовый Мешок d.gray

Это - элемент рандомной синонимизации для намеренного привнесения неточностей в описание с целью создания эффекта не абсолютного соответствия результата заданию.

Алекс У

Джутовый Мешок

16.02.24 12:11

0 0

Аплодисменты стоя! 😄 Убойное объяснение всего, включая шестипалые руки...

Джутовый Мешок

Алекс У

16.02.24 12:17

0 0

Ну так если GT, который тоже вроде бы ИИ, не в состоянии справиться со своей предельно формализованной задачей - фигли мы тут про пятиногих кошек?..

Так о чем и речь. До момента, когда нейросеть научится генерить достаточно качественные ролики, что бы ее можно было бы использовать хотя бы для изготовления клипов, еще очень далеко. Пока это просто забавная игрушка, не более.

Кстати: в задании монстр стоит на коленях, в видео сидит на жопе (или на корточках) - это тоже трудности перевода?

А вот это, кстати, косвенно указывает на то, что не было "описания по видео". 😄

d.gray

Джутовый Мешок

16.02.24 12:20

0 0

А вот это, кстати, косвенно указывает на то, что не было "описания по видео".

В том и дело, что не указывает. Сеть отловила некоторые ключевые характеристики, которые напрямую связала между собой, дополнив историю подходящими к этим узловым точкам заготовленными промежуточными элементами, - точно так же, как при "стоит" в задании получается "сидит" в реализации этого задания - система отрабатывает лишь "монстр (находится) у костра," реализуя то, что в скобках, так, как на душу ляжет.
Кроме того, в настройках сетки существует такой параметр, как степень отклонения от задания - как раз с целью получения вариантов на выбор.

Всё это работает как при визуализации текста, так и при описывании изображения - процесс анализа задания лишь имитируется с той или иной степенью обманчивой правдоподобности результата.

Алекс У

d.gray

17.02.24 12:52

0 0

Приведенные примеры впечатляют безмерно.

Примеры впечатляют, пока не начинаешь вглядываться в детали.
Например, можно понаблюдать за людьми, которые появляются из ниоткуда, а потом растворяются в воздухе.

iPetri

16.02.24 10:53

0 2

эта штука сгенерена полностью, в том-то и дело. С дополнениями и т.п. можно сделать все идеально

_as_

iPetri

16.02.24 11:06

0 0

В общем, основная задача людишек - как не сдохнуть от голода за время, пока повсеместная роботизация и ИИзация не приведут к миру базового дохода безработного населения Земли. А то вот пишут - трактористы, так в родном селе все тракторы и комбайны уже лет 20 заменены беспилотными по 1 шт. В них сидит не водитель, а скорее охранник, чтобы ничего не украли. Врачи? Тоже заменяемы. Сантехники? Роботы. И т.д. Все ржущие над недокодерами-ангулярщиками, ассемблера не знающих, тоже в опасности. Ты со своим ремеслом искусного кафельщика можешь оказаться в очереди на бесплатный талон для месяца социальной подписки на vr-интерактивные фильмы, создаваемые на лету ИИ по твоему запросу, рядом с хипстером с девиантарт, чьи порнофантазии на тему Вархаммер оказались такими же ненужными, как и твои казалось бы буллетпруфные дедовские навыки от сохи.

Daario Nahalis

16.02.24 10:52

3 7

Рекомендую прочитать «Ложную Слепоту» (Blindsight) Питера Уоттса – там как раз изложен подобный сценарий развития будущего. Некоторым, чтоб остаться востребованными, придется прибегнуть к использованию аугментаций своего тела и мозга. Большинство же останутся не у дел, их сознание будет оцифровано и переедет в «рай» – мир виртуальной реальности, в то время как их физические тела будут постоянно подключены к сети и находиться в колбе на складе.

elijahwoo

Daario Nahalis

16.02.24 20:27

0 0

Да, впечатляет.
Хотя у тётки на 18 секунде меняется правая и левая нога, а человек в белом за ней подпрыгивает на каждый шаг... (Даже не подпрыгивает, а шагает той же ногой по несколько раз.)

deadkitten

16.02.24 10:49

0 2

а человек в белом за ней подпрыгивает

Да там на заднем плане вообще полный беспредел творится. 😄 Люди боком ходят, склеиваются, появляются ниоткуда и исчезают в никуда. Какой-то чувак на ходулях явно и вообще все напоминают тормозных зомби.

d.gray

deadkitten

16.02.24 11:00

0 4

Люди боком ходят, склеиваются, какой-то чувак на ходулях явно и вообще все напоминают тормозных зомби.

Спросим у Игоря-сана, в каком районе Токио такое можно увидеть и после употребления чего именно.

Solmir

d.gray

16.02.24 11:06

0 8

После ссаке, разумеется!

Vinny_The_Poo

Solmir

16.02.24 11:33

4 0

А, кстати, интересно было бы дать этой нейросети задание: "вид из глаз пьяного в дымину мужика, который идет по Харадзюку и рассматривает встречных девушек".

d.gray

Solmir

16.02.24 11:41

0 1

в каком районе Токио такое можно увидеть

в Акихабаре можно и не такое увидеть, безо всяких веществ)) Кабукитё в Синдзюку тоже свойственно, местами.

Сэр Макс

Solmir

16.02.24 16:54

0 0

Я тоже нашел огрехи при просмотре, но производная впечатляет. Готов допустить, что представлены наиболее удачные видео, но скоро это может стать массовым инструментом.

Solmir

16.02.24 10:47

0 4

Мамонты пердят знатно!

Извините, но иначе объяснить поднимающиеся вверх облака пара невозможно...

Джутовый Мешок

16.02.24 10:30

1 6

Если дважды отправить одно и то же тестовое описание результат будет тот же?

Юрий П

16.02.24 10:28

0 1

Если на вход сети подать одинаковые настройки (кроме промпта там еще другие), то выход будет аналогичным

Другой вопрос в том, какие настройки они дают пользователю и не рандомизируют ли они скрытые параметры сами

bblu

Юрий П

16.02.24 10:43

0 0

Скорее всего нет, но может оказаться похожим. Так же как и с картинками.
Там обычно под капотом есть такое понятие как "seed" - и оно обычно задается рандомно.
Но есть системы которые позволяют задавать его вручную - и тогда результаты каждый раз совпадают.

freeflyer777

Юрий П

16.02.24 16:44

0 1

При генерации изображения тем же Stable Diffusion за основу берется картинка шума, то есть сгенерированная картинка случайных пикселов в которой нейросеть поэтапно "ищет" и "уточняет" собственно образ/изображение.
В компьютере случайность весьма не случайна (есть разные способы рандомизации - привязка к времени, например). В описанном случае привязка идет к натуральному числу, называемому seed (семя, зерно). При повторном соблюдении настроек (модель, разрешение и прочее), промта (текста запроса) и seed вы получите идентичный результат. При изменении seed вы получите другой результат. По seed собственно генерируется та самая изначальная картинка с шумом.

diiir

Юрий П

17.02.24 11:30

0 1

"— Мы в восхищении, — завывал ~~кот~~ Android" 😉

Android

16.02.24 10:25

0 3

У меня кот остался без лакомства. (((

Астронафт

16.02.24 10:21

0 0

А кто-нибудь в курсе, есть ли модель ИИ, способная адекватно генерировать и изображать текстовые логотипы? А то пробовал в нескольких - полная чепуха получалась.

Technomaniac

16.02.24 10:18

0 0

Только Николай иронов от студии Артемия Лебедева

inside

Technomaniac

16.02.24 11:22

0 0

Миджорни 6, далии 3, каскад (но к нему без 4090 с 24 гигами соваться бесполезно)

bilbo

Technomaniac

16.02.24 11:48

0 1

neural.love как раз для этого

Goza

Technomaniac

16.02.24 12:19

0 1

То, что показывали в бете Adobe FireFly впечатляло. Там как раз для текста отдельный модуль был.

mig74

Technomaniac

16.02.24 12:28

0 0

На civitai есть лора, которая вроде бы позволяет делать именно текстовые логотипы.

Kouzmich

Technomaniac

17.02.24 13:13

0 0

Впечатляет.
Хотя и не без огрехов. В первом ролике на 15 секунде у женщины ноги поменялись местами, а у кота две передние левые лапы.

odissey

16.02.24 10:17

0 10

Кроме того подошвы обуви у женщины немного едут относительно тротуара, когда стоят на нём.

Vinny_The_Poo

odissey

16.02.24 11:31

0 1

людям, занимающимся продажей видео на стоках приготовится...

Travmapevt

16.02.24 10:11

2 4

Ну если следующий Аватар снимут с бюджетом только на сценарий - тогда поверим

aka_mik

16.02.24 10:04

0 3

Не хотелось бы. Создавать условный Аватар - занятие приятное и увлекательное. Лучше искать те сценарии, где ИИ будет заменять неприятную работу.

Technomaniac

aka_mik

16.02.24 10:57

0 0

Ну если следующий Аватар снимут с бюджетом только на сценарий - тогда поверим

Сценарий будет сгенерирован ИИ в первую очередь:

Создание сценария для фильма требует совместных усилий и обычно включает в себя команду сценаристов, режиссеров и творческих умов. Тем не менее, я могу предоставить краткий обзор для следующей серии “Аватара”:

Название: Аватар: Хроники Элементального мира

Синопсис:
В мире, раздираемом противостоянием между технологическими достижениями и сохранением природы, племя на’ви сталкивается с новой угрозой. Группа амбициозных ученых, ищущих ресурсы, нарушает хрупкое равновесие экосистемы Пандоры.

Акт 1:

• Представление новых персонажей в племени на’ви, каждый из которых представляет различный элемент природы.
• Установление конфликта с вторгшимися учеными и их передовой технологией.
• Аватар Джейк Салли, теперь уважаемый лидер, принимает на себя ответственность объединить племена против общей угрозы.

Акт 2:

• Исследование мистического Элементального мира, скрытого глубоко в Пандоре, где древние силы держат ключ к восстановлению баланса.
• Аватар Джейк проходит духовное путешествие, чтобы связаться с элементальными духами и получить их направление.
• Подсюжет с ученым-человеком, который сомневается в разрушительных мотивах экспедиции.

Акт 3:

• Разворачиваются эпические битвы, когда на’ви и силы природы сталкиваются с захватчиками, демонстрируя силу природы против технологии.
• Аватар Джейк, вооруженный новыми способностями, ведет финальное сражение для защиты священных мест Пандоры.
• Ученый-человек дезертирует, объединяясь с на’ви, чтобы раскрыть истинные намерения вторгшейся группы.

Заключение:

• На’ви триумфируют, восстанавливая баланс на Пандоре и отправляя послание о важности сосуществования.
• Элементальный мир остается тайной, охраняемой на’ви для сохранения хрупкого согласия своего мира.
• История заканчивается намеком на возможные будущие приключения, оставляя место для продолжений.

frost

aka_mik

16.02.24 11:05

0 1

Не сильно похоже на описание конкретных сцен, как в посте Алекса

aka_mik

frost

16.02.24 11:08

0 0

На’ви триумфируют

Зрители фалломорфируют.

Vinny_The_Poo

frost

16.02.24 11:30

2 2

Забавный парадокс: доступный инструмент генерирования реалистичных, но полу-сновидческих фрагментов усиливает позиции независимого авторского кино. А чтобы снять блокбастер - по-прежнему необходимы человекочасы на каждую секунду видео и каждую деталь обстановки.

uzel

aka_mik

16.02.24 11:45

0 0

Кошка пятиногая, а у хозяйки кисть отвалилась
Но с первого просмотра, если не всматриваться - да, фиг поймёшь, что это сгенерированное видео

Programmist

16.02.24 10:04

0 9

Кошка пятиногая

А это вовсе и не хвост, ответил Серый Волк и густо покраснел. ©
Сначала запросили кошку, потом кота. Пришлось выкручиваться...

Джутовый Мешок

Programmist