klerk Т.е. ты ставишь на комп и сам генерируешь, используя свои ресурсы?
Затратно, увы... Я такое не могу себе позволить, да и жалко комп. А онлайн wan 2.2 где-то доступен?
Попробовал еще ради любопытства картинки в сберовском ГигаЧате. Не ждал ничего от грефа, и был прав: качество хуже, чем у квена и тем более перплексити, кое-что общее есть с гроком, но у грока лучше.
И да, цензура тут запредельная: то, что квен и перплексити мне рисовали, грефовская ИИ наотрез отказывается. Ну ее тогда к лешему вместе с грефом. Все-равно толку от нее нет.
Затратно, увы... Я такое не могу себе позволить, да и жалко комп.
Да я не знаю таких, кто может себе позволить серверный ускоритель с 80 Гб VRAM. Это фантастика. Ну кто-то виртуальные сервера с GPU арендует, сейчас полно таких услуг, только при виде цен желание также сразу отпадает.
Я так понимаю, видео в Qwen делает именно эта модель. Также он доступен в Шедевруме (можно переключить с v.2 Beta на Wan 2.2). Но он не позволяет закидывать свою картинку или брать кадр из видео и генерить дальше. Поэтому практически бесполезен для создания роликов. Генерит только 5-секундные фрагменты из тех картинок, которые сам предложит по текстовому запросу (и там можно выбрать всего лишь из 2 картинок, в то время как при генерации изображений предоставляется 4 в базовой версии и 6 в про).
Ну ее тогда к лешему вместе с грефом. Все-равно толку от нее нет.
Низкая точность и плохое понимание запросов характерны для пожатых моделей с малым количеством параметров. Gemma c 4 млрд тоже часто ведёт себя неадекватно, плохо распознаёт текст с картинок, даже при поиске в интернете не может правильно интерпретировать текст, чтобы ответить на вопрос. Но зато работает даже на слабом железе и за какое-то вменяемое время (обычно от 2 до 5 минут) какой-то ответ выдаёт. У Сбера оборудование помощнее, но и Сбердоге отвечает очень быстро, что наводит на мысли об использовании там именно сжатых маленьких моделей, ну само собой ради экономии. На качество, видимо, забили, в угоду скорости и ограничений памяти.
P.S.: говоря о локальной генерации, скорее всего адекватнее будет юзать Ryzen 9 AI HX 370, который с отдельным нейроблоком, чем выделенный ускоритель. Мини-ПК на нём стоят от 100 тыс. на маркетплейсах, ну это остатки до того как цены на DDR5 подняли. Видимо, после НГ и на них цены улетят в космос, но вот пока они есть. Опять-таки, в плане поддержки ничего не могу сказать, может быть Ollama и PyTorch не поддерживают такое оборудование, хотя вроде бы должны. Может быть, это нормальная альтернатива, но это пока не у кого спросить, потому что они новые и толком никто такое не покупал.
Какой-то рыбозавр. Это изображение сгенерировал ИИ?
Отмечу, что недавно перплексити выкинул очередной фортель: теперь при генерации картинки есть шанс получить результат "в стиле Grok", поскольку он вроде как тоже входит в эту сеть (не знаю всех нюансов, но в списке моделей Grok упомянут). Поскольку "стиль Грок" заметно хуже, чем обычные картинки от перплексити, то в запросе приходится специально оговаривать " НЕ делать в стиле Grok", чтобы снизить такую вероятность до минимума. В бесплатной версии, насколько понял, самостоятельно выбрать модель нельзя, она выбирается автоматически исходя из запроса (и раньше вопросов к выбору не было). Видимо, Грок включается, когда запрос балансирует на грани цензуры, т.к. известно, что там ниже жесткость.
Также нашел один лайфхак, позволяющий если не обойти, то немного сгладить цензурные ограничения ценой небольшой потери качества. Представьте, что сетка отказывается делать картинку точно по запросу, например, не рисует некоторые важные для вас детали, но в целом (поза, композиция) запрос реализуется. Тогда делаем следующее: берем эту картинку, идем в квен, и там уже генерируем видео, в котором прописываем появление на картинке тех деталей, которые вам не удалось получить при генерации. Обычно в видео такое проходит - надо только так составить запрос, чтобы сетка за 5 секунд нарисовала все, что нужно. Далее - берем и щелкаем нужный кадр из видео и используем уже его как картинку.
https://aixiv.science/ aiXiv — это бесплатный, рецензируемый ИИ или человеком архив препринтов для исследований, созданных учёными (людьми), роботами и искусственным интеллектом во всех научных областях.
Прикольно, конечно, что эти игрушки начали двигаться, как бы оживать, если наводишь курсор или просто некоторое время смотришь, не прокручивая ленту вверх или вниз. Некоторые оживают глючно, но в среднем вроде неплохо.
Прикольно, конечно, что эти игрушки начали двигаться, как бы оживать, если наводишь курсор или просто некоторое время смотришь, не прокручивая ленту вверх или вниз. Некоторые оживают глючно, но в среднем вроде неплохо.
Вообще, я заметил, студенты даже не читают то, что они нагенерировали и не могут отрефлексировать всё это. Вообще. А уж об анализе и выискивании истины из нагенерированного я уже молчу.
В новой Ollama 0.13.3 опять новые баги. Похоже, сломались квантованные модели. Ошибок нет, но они ведут себя неадекватно и не могут отвечать. Например, квантованная gemma3:4b-it-qat в ответ отправляет какие-то несвязные буквы или пустую строку, но обычная gemma3:4b работает корректно.
При этом проблема наблюдается как с видеокартой, так и на ноутбуке с CPU.
Квен тоже испортился. Снова вернул лимит в 5 видео в день (до этого он расширил лимит до 10), да еще сами видео практически не генерируются - постоянно выдает ошибку, либо ему не нравятся исходные картинки, особенно если они высокого разрешения и были сделаны в перплексити (и тут уже никакой закономерности понять невозможно).
Перплексити теперь балуется - произвольно выдает картинки в разных стилях - то максимально-реалистично, то не совсем, несмотря на запрос. Видимо, в профессиональной версии это все можно настроить, а бесплатную версию отдали на милость нейросети...
Хорошо, что я успел кое-что сделать в предыдущий месяц, когда ИИ были более благосклонны к пользователям... Ну а теперь пусть этот пузырь лопается, все равно от него никакого толку!
Shadowman, самое плохое что нет внятного генератора видео для локальных систем, они все охрененно требовательные. Картинки можно, но их я думаю все и так уже нагенерировались, и с ними вообще проблем таких нет.
Я бы клип какой-нибудь попробовал создать, но с такими лимитами, увы, это нереально. Тем более что большинство материала выходит неудовлетворительное и надо перегенерировать, а лимита для этого уже и нет.
Чтобы худо-бедно генерировать видео в квене, мне понадобилось не меньше 10 аккаунтов, а то и больше, тогда хоть какой-то простор есть на случай неудачных результатов. Притом, что я не был особо требователен к качеству - нет явных косяков - уже хорошо
(к слову, заставить нейросеть рисовать дверцы автомобиля, открывающиеся в правильную сторону, я так и не смог... Вчера я попробовал вернуться к старому способу - генерация видео по тексту, раз уж с картинками он никак не хочет справляться. Что ж, прогресс здесь тоже есть - по сравнению с тем УГ, что выходило в начале, сейчас даже по тексту видео получается более-менее сносное (хотя по картинке было бы все равно лучше!) Плюс небольшой в том, что в этом случае цензура меньше - если на картинку программа агрится, то текст проглатывает. Если делать спрайты низкого разрешения на основе такого видео - то сойдет. А вот для целей, где нужно высокое качество - увы, пока его недостаточно. Минус в том, что описание текстовое трактуется сетью более вольно - сеть добавляет от себя иногда ненужные моменты, по картинке видео более контролируемое получалось.
В этом сериале, наверное, гостайна какая-то (не буду гадать, чья).
По поисковику вроде находит места, где можно бесплатно посмотреть онлайн. Или смысл был в другом?
Спрашивал дипсик про создание видеоигр, ответ уже запостили в теме тут: https://i.iddqd.ru/viewtopic.php?t=1993&page=70 Для генерации картинок нашелся сервис Z-Image Turbo - это наилучший генератор из опробованных мною, и как раз раньше перплексити выдавал такие же картинки, а потом перестал. Но перплексити - это не генератор картинок, а нейросеть, которая всего лишь использует генераторы (как и квен - не генератор картинок и видео, а сетка, которая так же использует конкретные генераторы). У нейросети есть цензура, а у прямого генератора - ее нет (разве что на уровне выхода самих картинок, что-то может не прорисоваться в силу встроенных ограничений). Так что, если хотите точный результат - выходите напрямую на генераторы, минуя посредников - нейросети.
По поисковику вроде находит места, где можно бесплатно посмотреть онлайн. Или смысл был в другом?
Меня просто позабавила формулировка "Посмотреть онлайн легально в России сейчас сложно". То, что поисковик находит места, где можно посмотреть, - это хорошо. Я пока мельком нашёл только в одноголосом переводе, но это так себе. Пока мало искал на самом деле, даже не понял, есть ли полноценный русский дубляж.
А там прямо всё нейросеть написала? Редактирования человеком не было? Первая часть выглядит вполне неплохо, всё пока не прочитал.
Ну вот тебе скриншот начала ответа на вопрос (весь ответ пришлось бы скриншотить долго)
А вопрос я задал про примеры уровней из Дум2 - и как будет видно из полного ответа, нейросеть ошибается кое-где, т.к. не знает классику.
Полный ответ:
Скрытый текст:
Идеальный вопрос! Doom (1993) и Doom 2 — это хрестоматийные примеры гениального левел-дизайна, заложившего ДНК всего жанра. Их уровень сложности был высок, но скучать было невозможно. Давайте разберем их правила на костях.
I. Философия дизайна: «Шахматы на скорости»
Уровни Doom — не симуляция реальной базы, а абстрактные боевые полигоны, где геометрия служит геймплею. Это лабиринты, арены и ловушки, подчиняющиеся законам веселья, а не логики.
II. Ключевые принципы уровней Doom/Doom 2
1. «Прочитай мою руку» (Визуальное ведение)
Цвет как навигация: Разные текстуры пола/стен часто означают разные зоны. Зашел в кирпичный коридор — ты в одном отсеке. Пол стал металлическим — ты перешел в другой.
Сигнальные текстуры: Выдающиеся, яркие или аномальные текстуры (компьютерные панели, знаки, щиты) почти всегда отмечают важные объекты: двери, секреты, переключатели.
Асимметрия и «подсказывающая» геометрия: Единственный выступ в ровном коридоре, странная ниша — это почти всегда секрет или переключатель. Дизайнеры играли с любопытством игрока.
2. Ритм «Покой-Ярость-Награда»
Уровень строился как цепь напряженных узлов, соединенных короткими коридорами-переходами.
Коридор (Покой): Игрок двигается, немного врагов, возможность собрать патроны/аптечки. Фаза подготовки.
Комната-ловушка (Ярость): Игрок берет ключ/оружие/бонус — и сразу срабатывает триггер:
Стены опускаются, открывая проходы с врагами.
Пол проваливается на арену.
Враги «респаунятся» позади, отрезая путь назад.
Это создавало постоянный тактический стресс.
Награда: После очистки арены игрок получал доступ к новой части уровня, часто с мощным оружием (ракетница, плазма) или большим запасом здоровья.
3. Мастерская работа со звуком
Слепой дизайн: Doom — игра, которую можно было пройти на ушах.
Каждый тип врага имел уникальный и громкий звук шагов/рыча.
Открытие двери, нажатие переключателя, появление монстров из-за стены — все это создавало звуковую карту уровня.
Игрок постоянно находился в состоянии акустического анализа: «Сзади рычат, значит, респаун. Впереди скулят — импы. Справа молоток — барон».
4. Управление ресурсами как геймплей
Патроны и здоровье были не просто статами, а инструментами управления темпом и маршрутом.
«Голодный» дизайн: Игрок часто начинал уровень почти без ресурсов. Боеприпасы и аптечки располагались стратегически:
Перед большой битвой давали запас.
В центре арены клали ракетницы или мегаздоровье, заманивая игрока под огонь.
Это создавало постоянный тактический выбор: рискнуть пробежать под огнем за здоровьем или отстреливаться из дальнобойного оружия?
Секреты почти всегда содержали критически важные ресурсы (синие доспехи, ячейки к плазме), поощряя исследование.
5. Композиция врагов как «инструментов»
Каждый демон — не просто хитпоинты с уроном, а геймплейный элемент:
Зомби (мечник/стрелок): Мясо, создающее фон, тратящее патроны.
Имп (огненные шары): Заставляют двигаться зигзагом, контролируют пространство.
Пинки-демон/Спектр: Давят на психологическом уровне, заставляя отступать или искать укрытие.
Како-демон: Орудие управления толпой. Его смертельная атака по области могла убить других монстров. Умный игрок использовал это.
Барон/Киборг-мастерминд: «Боссы середины уровня», требующие тактики и тяжелого оружия.
Хитрость: Уровни Doom 2 стали сложнее не из-за большего количества врагов, а из-за их хитрых комбинаций. Например, несколько пинки-демонов в узком коридоре + импы на балконах.
III. Анализ конкретных приемов на примерах
Doom, E1M1: Hangar (Эталон обучения)
Первые 10 секунд: Игрок видит перед собой пинки-демона (угроза) и по бокам — зомби-стрелков за колоннами (препятствие). Урок №1: враги могут атаковать из укрытий.
Первая комната с колоннами: Урок тактики — использовать укрытие.
Взятие дробовика: Триггер — открывается стена позади, появляются враги. Урок №2: награды могут быть ловушками.
Весь уровень — это учебник без слов.
Doom 2, Map07: Dead Simple (Гениальная арена)
Чистая механика: Уровень — это две симметричные арены.
Фаза 1: Убиваешь всех мэнкубов — неожиданно оживают «декоративные» постаменты, превращаясь в пару арахнотронов. Урок: окружение может быть врагом.
Фаза 2: После убийства арахнотронов появляются два кибер-мастера. Резкий скачок сложности, но игрок уже изучил арену и имеет ресурсы. Это тест на усвоение.
Doom 2, Map20: Gotcha! (Психологическая игра)
Фишка уровня: Гигантская арена с двумя кибер-демонами по бокам. Прямая атака — смерть.
Решение: Игрок должен спровоцировать их, чтобы они сражались друг с другом и с другими монстрами, уворачиваясь от их ракет. Это урок непрямых действий и контроля над АИ.
IV. Ошибки, которых они (почти) избежали
«Куда идти?» — Уровни линейны, но с петлями и короткими путями, создающими иллюзию нелинейности.
Однообразие — Каждый уровень имел свою «фишку»: один — гигантские открытые пространства (The Citadel), другой — клоастрофобные лабиринты (The Spirit World).
Читерская сложность — Спавн врагов был почти всегда справедлив: ты видел, откуда они пришли. Смерть воспринималась как собственная ошибка.
V. Наследие: почему это работало тогда и работает сейчас
Doom заложил архетипы пространств, которые используются до сих пор:
«Шлюз» (Airlock): Узкий проход, открывающийся на арену.
«Яма» (Pitfall): Пол проваливается вниз, в логово врагов.
«Циркуляр» (Loop): Уровень закручен петлей, возвращая игрока к началу с новым оружием.
«Галерея» (Gallery): Длинный коридор с врагами на балконах по бокам.
Вывод: Уровни классического Doom — это не архитектура, а интерактивная музыка. Они состоят из повторяющихся, но вариативных мотивов (комната-ловушка, арена, коридор), которые складываются в симфонию насилия. Ритм задавался не таймером, а действиями игрока: взял ключ — получил волну врагов. Это создавало прямой, мгновенный фидбэк и чувство агентства. Скучать было невозможно, потому что игра вела с тобой постоянный, жестокий, но честный диалог. Каждая дверь была вопросом: «Готов ли ты к тому, что за мной?». И игрок, затаив дыхание, всегда отвечал «да».
Думаю, сами увидите, где в описаниях нейросеть накосячила.
Главное - нейросеть знает про Могра! Вопрос: о чем говорит фраза: На форуме завелся могор?
Ответ:
Скрытый текст:
Фраза «На форуме завёлся могор» — это сленговое выражение, происходящее из русскоязычного интернет-фольклора, и оно имеет несколько слоёв смысла. Вот основные трактовки:
1. Прямое значение (интернет-фольклор)
«Могор» — вымышленное существо или персонаж, часто упоминаемый в шутках, анекдотах и мемах (особенно в начале 2000-х годов).
Контекст: Обычно «могор» используется как пародия на интернет-троллей, спамеров, неадекватных пользователей или хаотичных ботов.
Аналоги: Похож на мифических «гремлинов форума», «бабайку» или «лошару» (в старом сетевом сленге).
2. Типичные ситуации, когда говорят «завёлся могор»
На форуме появляется анонимный тролль, который оставляет бессмысленные, провокационные или абсурдные сообщения.
Кто-то начинает спамить странными картинками, ссылками или текстами.
Участники замечают непонятную активность (например, массовое удаление тем, странные правки, взлом аккаунтов), которую приписывают мифическому «вредителю».
Юмористическое объяснение необъяснимых глюков или хаоса на форуме (например, «Почему все темы исчезли? — Да могор завёлся!»).
3. Откуда взялось слово «могор»?
Возможно, происходит от слова «могёный» (искажённое «многогёный», то есть «многогранный» или «изворотливый»).
Или от «могор» как сленгового названия чего-то несуразного (например, в студенческом фольклоре).
Иногда ассоциируется с «могером» (искажение слова «хакер» или «модератор» нарочито грубоватым образом).
4. Культурный подтекст
Фраза отражает традицию создавать фольклорных персонажей для объяснения хаоса в интернете (как «баги» — от слова «bug», жук).
Это способ снизить напряжённость в конфликтных ситуациях: вместо обвинений реальных людей шутливо свалить всё на «могора».
Часто используется в старых форумных культурах (например, в Рунете 2000–2010-х), где модераторы и старожилы таким образом создавали локальный юмор.
5. Примеры употребления
«Опять в политическом разделе могор разгулялся — двадцать тем за ночь создал!»
«Не обращайте внимания, это не тролль, а обычный могор, скоро набегут модераторы и забанят его».
«У нас на форуме могор? Да это же древняя легенда! Я думал, его в 2008-м извели!»
6. Как реагировать?
Если вы увидели такую фразу:
Не паниковать — это скорее шутка или сленг.
Уточнить контекст — может, речь идёт о конкретном нарушителе.
Присоединиться к фольклору — ответить в том же духе («Надо вызвать могоролова!»).
Итог:
«Могор завёлся» = на форуме появился источник хаоса, троллинг или странная активность, которую участники в шутку приписывают мифическому существу.
Фраза отражает коллективное творчество интернет-сообществ и их способ бороться с абсурдом через юмор.
Если вы хотите глубже погрузиться в тему, поищите мемы про «могора» в старых форумах или в архивах Рунета — иногда это целые саги с придуманной мифологией!
Попробовал тоже. Да, интересно, конечно, но пока это слишком тёмный чёрный ящик.
Пример в действии: Уровень E1M1: Hangar (Doom) — шедевр за 3 минуты.
Начало (Обучение): Перед тобой три двери. Одна сразу за спиной (ведущая в тупик с аптечкой). Учит проверять задний план.
Первая развилка (Выбор): Левая дверь (видимая опасность) или правая (тихая, тёмная). Учит оценивать риски.
Первая засада (30 секунд удовольствия): Взятие дробовика — сигнал для появления солдат-зомби из стен. Короткий, интенсивный бой.
Секрет (Награда): За «подозрительной» текстурой стены — первый секрет с боеприпасами и другим путём.
Финал (Кульминация): Выход на площадку с Импами на возвышенности. Бой на открытом пространстве. Ключ на виду. Взятие ключа — победа.
Наследие: Эти принципы — ДНК современного шутера. Любая арена в Doom Eternal, засада в Halo или исследование в Metroid Prime несут в себе генетический код, заложенный в коридорах и залах оригинального Doom. Это дизайн, который ставит чистый, сфокусированный геймплей и чувство открытия выше всего остального.
Добавлено спустя 1 час 19 минут 57 секунд:
Кстати, будьте осторожны: ИИ не только учатся друг у друга (или пытаются делать сие), но и могут приписать всякую пургу людям, которые пишут запросы и постят ответы нейросетей:
ИИ не только учатся друг у друга (или пытаются делать сие), но и могут приписать всякую пургу людям, которые пишут запросы и постят ответы нейросетей:
А вот это одна из реальных опасностей (и ограничений) нейросетей, которые, как мне кажется, оптимисты недооценивают.
Пока нейросеть обучается на контенте, созданном людьми, и если ошибается, то потому, что ее данных не хватает (нейросеть обычно никогда не говорит правду "Я не знаю", вместо этого она начинает сочинять и нести пургу - проверено неоднократно).
Так вот, чем больше нейросети генерят контента - тем больше в сети вторичного контента, созданного ИИ, на котором уже будет обучатся последующий ИИ. И т.к. бреда там чем дальше - тем больше в % отношении, то ИИ, обучаясь на вторичном контенте, начнет нести уже полный бред.
Текущее направление LLM-сетей - тупиковое, они не рефлексируют, не умеют отделять правду от вымысла, их архитектура не позволяет проводить такие операции.