Shadowman, если бы можно было в Шедевруме загружать свою картинку и по ней видео генерировать, то вообще было б отлично, не знаю почему до сих пор не сделали. Потому что там среди моделей тоже есть Wan 2.5 с хорошим качеством генерации. Хотя ограничение на 5 сек, но можно закинуть 100 р. и никаких ограничений тогда вообще нет. Вчера Сбер анонсировал генерацию видео, пока только в боте Телеграм и там есть ограничения, но бесплатно. Я не пробовал, может и правда оно того стоит. Интересно, что на сайте Гигачада такую возможность пока не завезли (так что опять гигачад оказался обычным доге). Похоже, бесплатно будет только в ближайший месяц, а дальше они сделают всё по подписке, я уверен что так и будет. Учитывая, что сбердоге плохо понимает запросы, за деньги думаю оно не стоит того точно.
Продолжаем изучать возможности нейросетей.
На этот раз подумал, а почему бы не использовать генерацию видео для создания спрайтов в разных позициях? Всего-то нужно облететь камерой в трехмерном пространстве вокруг объекта, а затем уже нащелкать кадров в стандартных дум-позах 2-8 (или 2-5, если позы симметричны).
Ну вот и попробовал, что получится?
Квен спрайты воспринимает как плоские фигуры, хотя возможно, надо было ему указать, что объект объемный.
Видео делается долго - в отличие от видео по картинкам, кстати.
Пара примеров:
Огненный скелет Spider Demoness Работы в любом случае ручной будет много - мало сделать правильные видео по каждой позиции (а их может быть много), так потом еще с каждого видео нужно нащелкать кадров в правильном ракурсе, убедиться, что сеть ничего не напутала и не дорисовала лишнего, потом очистить фон, убрать белые точки, сжать изображение до приемлемого для дума размера и т.д...
Но как возможная технология - почему бы не рассмотреть?
klerk Заметил, что с недавних пор perplexity испортился. Раньше он старался точно следовать запросу, если получалось проскочить цензуру (если не получалось - честно писал, что такой запрос реализовать не сможет). Потом он стал переиначивать запросы, сокращая их, иногда выбрасывая детали, но в целом следуя. Цензурных вылетов стало меньше. А вот сегодня обнаружил, что он стал резко сокращать запрос, выбрасывая все существенное, в результате выдает совсем не то, что нужно.
Как это лечить, я не знаю, разве что программа сама образумися и начнет все же рисовать по запросам, а не пороть чушь. Надо снова квен попробовать - хоть качество рисовки у него ниже, но ранее хотя бы запросам он следовал точно.
Shadowman, я время от времени встречаю в соцсетях устаревшее, но пока распространённое мнение, что китайские сети зацензурированы. На деле же цензура в западных изначально выше, а теперь новые меры цензуры в них становятся настолько шизоидными, что после их внедрения вообще перестаёт хоть что-либо работать. Sad, but true.
klerk Если сравнивать квен и перплексити, то у второй цензура изначально была строже, сейчас, как уже описал, совсем плохо стало. Хотя квен тоже ужесточил цензуру - я проверял по старым запросам 2-месячной давности: то, что раньше рисовало, теперь при попытке новой генерации на тот же запрос выдает ошибку (хотя может это не цензура, а "устаревание", типа слишком старый запрос - не знаю).
По видео сравнить не с чем, т.к. их делаю только в квене. Но порой удивляюсь странностям китайской цензуры: например, обычную батальную сцену (перестрелка солдат) он наотрез отказывался делать по картинке. Когда поменял запрос на "солдаты прекращают стрельбу и т.д. ", то видео нарисовал.
Получается, любые батальные сцены с людьми на видео уже не сделать - что глупо, т.к. отсекает значительную часть возможных сюжетов. И при чем тут цензура, когда у нас военное кино в реале - нормальный жанр.
Shadowman Оно в принципе понятно. Ведь слишком легко стало генерить фейки о разных текущих и прочих событиях. А картинки и видео пипл хавает, не особо-то разбираясь. Жаль, конечно, что с цензурой под раздачу попадают и те, кто ничего плохого и в мыслях не имел.
А тебе насколько оно нужно? Хочешь катсцены сделать для нового вада или что?
Ведь слишком легко стало генерить фейки о разных текущих и прочих событиях. А картинки и видео пипл хавает, не особо-то разбираясь.
Поверь мне, если ты будешь генерировать картинку или видео на основе бесплатной нейросети, то за правду ее можно принять ну только если отключить критическое восприятие напрочь. Настоящие фейки генерируются на основе профессиональных (т.е. явно не бесплатных) ИИ-сетей, но они для рядового пользователя закрыты.
Так что вот такие зверства цензуры не понятны.
Я бы, например, сделал по другому: разрешил бы пользователям генерировать абсолютно все, что они хотят увидеть, но при попытке выложить в открытый доступ (т.е. для неограниченного круга лиц) результаты, содержащие подцензурные элементы, запрещал бы автоматом такое выкладывание. Тут все в плюсе: и общество ограничено от разного рода некорректностей, и авторы довольны, что им дали возможность реализовать то, что они хотят.
Прочитал, что Grok от Илона Маска - наименее цензурированная сетка. Попробовал. Да, она рисует по запросам, по которым перплексити с недавнего времени стал косячить, хотя качество рисовки немного хуже, чем у перплексити (и к сожалению, артефакты с неправильным количеством пальцев порой присутствует). Правда, там всего 10 кредитов бесплатно, на реалистичную картинку уходит 5 кредитов, так что за 1 аккаунт можно сделать 2 изображения всего. Но зато отказов пока не встречал, и ее промт можно предварительно проверить.
А тебе насколько оно нужно? Хочешь катсцены сделать для нового вада или что?
Ну пока что я скорее изучаю эти возможности, пробую, так сказать, то и се. В принципе, для кат-сцен в вадах - самое оно, если конечно в гздум можно вставлять видеоролики (не разбирался с этим еще). Но зато какие возможности открываются! Не нужно будет мучиться и создавать кучу локаций, пролетов камеры в них, ставить нужных НПС, да еще пытаться сымитировать их действия скриптами - если в видео это все можно будет показать сразу.
Я бы, например, сделал по другому: разрешил бы пользователям генерировать абсолютно все, что они хотят увидеть, но при попытке выложить в открытый доступ (т.е. для неограниченного круга лиц) результаты, содержащие подцензурные элементы, запрещал бы автоматом такое выкладывание.
Вроде бы логично и здорово, но вряд ли реализуемо. Вот сделал ты, допустим, очень крутую нейросеть. Ты её можешь контролировать, в т.ч. цензуру какую-то сделать. А если цензура на этом этапе будет нулевая, то дальше контролировать как? Ведь есть большое количество соцсетей, мессенджеров и прочих площадок, которые ты не контролируешь. Да и не на всех площадках есть техническая возможность быстро распознавать и блокировать какие-то картинки или видео.
В принципе, для кат-сцен в вадах - самое оно, если конечно в гздум можно вставлять видеоролики (не разбирался с этим еще). Но зато какие возможности открываются! Не нужно будет мучиться и создавать кучу локаций, пролетов камеры в них, ставить нужных НПС, да еще пытаться сымитировать их действия скриптами - если в видео это все можно будет показать сразу.
С одной стороны да, а с другой стороны, если делать так часто, игроки начнут чувствовать, что уже не то. Ведь, когда ты честно делаешь то, что перечислил, игрок воспринимает катсцену как часть игрового мира. А с нейросетевыми видео - не то чтобы седьмая вода на киселе, но, очевидно, не совсем то.
А так, опыт, конечно, полезный. Ибо нейросети - новая реальность, с которой нам, видимо, жить до конца наших дней. Если только пипл не разочаруется в такой степени, что популярность заметно упадёт.
Да и не на всех площадках есть техническая возможность быстро распознавать и блокировать какие-то картинки или видео.
Да, сейчас так, поэтому имеем то, что имеем. Но в перспективе те же площадки и чаты будут использовать ИИ - и почему бы им его не использовать для контроля размещаемого контента в открытом доступе (т.е. для неограниченного круга лиц - это ключевой момент). И тогда отпадет необходимость в цензуре при генерации контента, а цензура переместится на его публичное распространение. Считаю, что такой подход единственно правильный.
С одной стороны да, а с другой стороны, если делать так часто, игроки начнут чувствовать, что уже не то.
А часто и не надо. Более того, на самих картах лучше все же скриптовать сцены средствами карты, чтобы у игрока не создавалось ощущение каши. А вот для межуровневых заставок или глобальных стартовых и финишных заставок - как раз видеоформат бы подошел. Можно вспомнить хотя бы те же заставки между эпизодами в дьябло 2. Хоть и были рисованые мультики, но на атмосферу работали хорошо.
Вот представь, что в дум 2 вместо скучного текста между эпизодами показывали бы краткие ролики - как морпех стоит среди руин космопорта, и озирается по сторонам, потом идет в сторону города. Или как из города морпех попадает в портал в адское измерение. Мелочь, а приятно.
Но в перспективе те же площадки и чаты будут использовать ИИ - и почему бы им его не использовать для контроля размещаемого контента в открытом доступе (т.е. для неограниченного круга лиц - это ключевой момент). И тогда отпадет необходимость в цензуре при генерации контента, а цензура переместится на его публичное распространение.
Площадок много, и у них разные хозяева с разными интересами. Уже в силу этого мне тот вариант, про который ты говоришь, пока видится утопичным.
Если только пипл не разочаруется в такой степени, что популярность заметно упадёт.
Впрочем, есть как минимум ещё один вариант, может даже более вероятный. В развитых странах ИИ будут контролировать, как писал вроде тут выше один наш товарищ (только, в отличие от него, я бы не стал утверждать, что все остальные сдохнут).
ИИ будут регулировать в развитых странах, там население сумеет отстоять свои права. ( уже была победа актёров озвучки в USA).А вот все остальные сдохнут. Без шуток.
Написал запрос в qwen "песня о белых пятнах на компьютерном кресле".
И вот, что оно выдало:
Скрытый текст:
Вот авторская шуточная песня о «белых пятнах на компьютерном кресле» — в стиле поп-рок с ноткой бытовой лирики и абсурда. Подойдёт для исполнения под гитару или с синтезатором 😊
---
🎵 **«Белые пятна на кресле»**
*(стиль: поп-рок / бытовой шансон-ирония)*
**[Куплет 1]**
Сижу я в потоке задач и идей,
Экран мерцает, как маяк в тишине.
Клавиши стучат — как дождь по стеклу,
А на кресле — *белые пятна*, как снег на углу…
Не молоко, не пепел, не пыль —
Это что-то другое… почти миф и стиль.
След от кофе? Нет. От затылка? Увы.
Это — *тайна*, что тихо живёт в глубине головы.
**[Припев]**
О, белые пятна на кресле моём —
Как следы от мечты, что не сбылась вовремя в нём.
Я не ел, не пил, не валялся в снегу…
Просто *слишком долго* сижу в интернет-лабиринте.
Может, это — пепел от идей?
Или соль от слёз прошлых ночей?
Белые пятна — как знак вопроса:
«Ты живёшь… или просто *в режиме паузы*?»
**[Куплет 2]**
Кошка мимо прошла — не она…
Пылесос молчит, как предатель весна.
Пятна будто растут на рассвете —
Словно *время* оставило след на обивке в секрете.
Я читал про «статику», пыльную взвесь,
Про кожу, пот, и про «эффект дисперсии тел».
Но наука молчит. Только ветер в окне
Шепчет: *«Это — отпечаток твоей глубины»*.
**[Припев]**
О, белые пятна на кресле моём —
Как артефакты дней, что прошли без огня и озноба.
Я не спал, не гулял, не летал на Луну —
Просто *думал всерьёз*, что работа — не каторга, а суть.
Может, это — снег из экрана?
Или пепел от слов, что не вышли в эфир?
Белые пятна — как *пункт назначения*:
«Покинь это место… но *куда*? Уже поздно. И сир.»
**[Бридж]** *(тихо, с паузами)*
Однажды приду — а кресло скажет:
«Я помню твой вес, твой вопрос без ответа.
Я помню твой страх, твой смех, твой бред…
А белые пятна — это *ты*, только всухую, как след».
**[Финал]**
…И я останусь сидеть —
Пока пятна не станут *картиной мечты*.
А вдруг — это *звёздная пыль*?
Та, что падает с неба…
…в поисках *нас* и *клавиши Ctrl*?
---
Если хочешь — могу сделать более мелодичный вариант (например, в стиле «Наутилуса» или «Земфиры»), или даже рэп-куплет 😉
Или… может, это начало концептуального альбома *«Офисная космология»*? 🪐
Oville Неплохо, если доработать - может и за настоящую песню сойти.
Но по текстам, на мой взгляд, лучше специализируется DeepSeek. А квен скорее по изображениям и видео.
P.S. До чего порой странно выглядит цензура в квене Попросил создать видео по картинке, где женщина чистит картошку, в одной руке нож, в другой картофелина, рядом ведро с картошкой. Наотрез отказывается! Подозреваю, что ему нож в кадре не нравится (так же как ранее в картинке про солдат в кадре были выстрелы из оружий), но как же чистить картошку без ножа? А вот когда поменял запрос на "женщина ест картофелину, которая у нее в руке и т.д. " (сырую! ) - то квен сделал видео без проблем...
Неисповедимы пути нейросетевые, эх...
Грок тоже умеет делать видео, но бесплатных 10 кредитов хватает только на видео низшего качества (хуже, чем у квена) за 5 секунд, без звука. Хотя с цензурой у него мягче - уж "чистить картошку" для него нормальная тема, и видео он мне сделал, хотя оно и вышло немного несуразное (за 5 секунд картошку не очистить...). Но тут уж качество бесплатного продукта слишком низкое, так что не вариант...
А вообще взаимодействие объектов на видео - больная тема нейросетей. Им еще учиться и учиться! Всякие залипания и проходы одного объекта сквозь другой там, где в реальности такое невозможно в силу законов физики, для сетки - привычное дело. Не умеет он в физику реального мира, и даже детальные запросы не всегда спасают ситуацию...
Неплохо, если доработать - может и за настоящую песню сойти.
По-моему стиль весьма похож на самого Oville. Так что очень возможно, что "если" на самом деле избыточно.
Добавлено спустя 1 час 52 минуты 13 секунд:
Небезынтересная новость подъехала. Если совсем кратко, европарламент проголосовал за рекомендацию о запрете соцсетей и нейросетей (сходство по Фрейду ), а также video-sharing platforms, для детей до 16 лет.
Нейросети запретить вообще (кроме научно-исследовательских целей, а так же выполнения рутинных алгоритмизированных действий и работ, связанных с риском для здоровья и жизни людей, например в химической, угольной, металлургической промышленности и т.п.. А так же в политике - всех президентов и чиновников заменить послушными машинами; Парламенты и Советы наделить функциями контроля и управления этими машинами. Короче, робот должен работать, а не пытаться заменить человека там где не надо.).
Соцсети разделить по профилям и возрастам, чтобы не были похожи на помойки.
Лутбоксы в играх отменить. Методы психологического воздействия, вызывающие привыкание, тоже отменить.
Небезынтересная новость подъехала. Если совсем кратко, европарламент проголосовал за рекомендацию о запрете соцсетей и нейросетей (сходство по Фрейду ), а также video-sharing platforms, для детей до 16 лет.
Pff. Я думаю дети куда более продвинутые нынче, чем раньше, и обязательно схитрят.
Уж поверьте мне, человеку, который 15 лет тому назад зарегистрировал свой аккаунт на Ютубе. А тогда мне было 12-13 лет, а регаться на этом хостинге до 18 лет было запрещено.
Так что ничего не получится.
нынче, конечно, не как сейчас. А тогда-то оно вообще ещё было!
Я хотел сказать, "раньше". Ну в общем, дети сейчас другие. И они найдут любую лазейку. Могут схитрить, могут выдать себя за кого угодно. Но обязательно сумеют зарегаться.
Как вариант, можно при регистрации в соцсетях показать фотку паспорта или иные данные. Но и это можно будет обойти, юзая нейросети. Технологии-то развиваются. А следовательно, и хитрость тоже.
Схитрят, не схитрят, это уже следующий вопрос (кто-то конечно схитрит). Но важно уже и то, что считается нормой, а что нет.
Кстати, Taw Tulki. Может дети и стали куда более продвинутые (в чём лично у меня есть сомнения), но и технические средства тоже развиваются. Хотим мы того или нет. В том числе и механизмы подтверждения возраста...