Welcome to U.A.C. [O.S.A.]
login / register 
Status: Guest
Архивы форума | iddqd.ru
Wolf 3D
ПравилаПравила ПоискПоиск
18+
Нейросети и всё что с ними связано Пред.  1, 2, 3, 4
   Список разделов - Болталка - Нейросети и всё что с ними связаноОтветить
АвторСообщение
klerk
- 2nd Lieutenant -
Next rank: = 2nd Lieutenant = after 128 points
1312

Doom Rate: 1.17

Posts quality: +989
Ссылка на пост №61 Отправлено: 29.05.25 15:58:32
Я заметил, что если поднять количество источников в веб-поиске, то полезность локальной Gemma 3 существенно возрастает. Всё-таки главный недостаток слабой модели в том, что она мало знает, но если дать ей искать, в целом ряде вопросов этот недостаток можно сократить. Конечно, она не сравнится с большой нейросетью, но учитывая смешные требования к оборудованию, отношение пользы к затраченным ресурсам получается впечатляющее.
1 11
BL@CK DE@TH
Lieutenant Colonel
Next rank: - Colonel - after 202 pointsМодератор форума
3838

Doom Rate: 1.37

Posts quality: +2155
Ссылка на пост №62 Отправлено: 29.05.25 22:13:15


Скрытый текст:

Видео полностью сгенерировано новой нейросетью Google Veo 3 — от озвучки до каждого кадра.


Рейтинг сообщения: +1, отметил(и): camper
1 2 1
camper
- Sergeant Major -
Next rank: = Sergeant Major = after 36 points
564

Doom Rate: 1.47

Posts quality: +300
Ссылка на пост №63 Отправлено: 29.05.25 23:47:01
Когда уже полнометражное ИИ кино появится.
1
klerk
- 2nd Lieutenant -
Next rank: = 2nd Lieutenant = after 128 points
1312

Doom Rate: 1.17

Posts quality: +989
Ссылка на пост №64 Отправлено: 30.05.25 19:35:37
Ollama теперь обновляется почти каждый день, и в текущей версии 0.9.0 впилили поддержку режима рассуждения (thinking mode), сходу же была обновлена модель DeepSeek для Ollama, которая теперь его поддерживает на этой версии. До этого в основном фиксили баги и вносили мелкие правки. DeepSeek тяжеловата, я всё ещё жду (хоть об этом никто и не объявлял), что релизнут новую Gemma 3n, где будет настоящая мультимодальность, а требования к ресурсам - ещё ниже. Надеюсь, такой релиз будет и эта Джемма не останется "эксклюзивом" AI Studio и её реально можно будет крутить локально (а ради этого вроде как она и существует, в отличие от большой Gemini).

Я же пытался с помощью DeepSeek сгенерировать движок для блога на PHP, чтобы посмотреть, как он справится с такой задачей.
Думаю, вы уже догадались, что...
Скрытый текст:

в итоге он не работает :x



Хотя бот очень старался и все скрипты сделал.
1 11
klerk
- 2nd Lieutenant -
Next rank: = 2nd Lieutenant = after 128 points
1312

Doom Rate: 1.17

Posts quality: +989
Ссылка на пост №65 Отправлено: 06.06.25 02:22:51
А вот это было мощно. Старые программы на старых лиспах и фортранах спасены!

Скрытый текст:



P.S.: и даже leetness speakage

Скрытый текст:


Рейтинг сообщения: +1, отметил(и): Zveraboy
1 11
BL@CK DE@TH
Lieutenant Colonel
Next rank: - Colonel - after 202 pointsМодератор форума
3838

Doom Rate: 1.37

Posts quality: +2155
Ссылка на пост №66 Отправлено: 28.06.25 00:36:12
Попробовал нейросеть Hunyuan 3D, которая конвертирует фотографии и изображения в трёхмерные модели.

https://synexa.ai/explore/tencent/hunyuan3d-2

Учитывая качество спрайтов, модель и текстура получились не очень:


Рейтинг сообщения: +3, отметил(и): Y-Dr. Now, klerk, SilverMiner
1 2 1
lafoxxx [B0S]
- Captain -
Next rank: = Captain = after 242 points
2098

Doom Rate: 1.39

Posts quality: +967
Ссылка на пост №67 Отправлено: 28.06.25 15:01:10
BL@CK DE@TH
Нормально получилось. Для подготовки к последующей обработке сойдёт. Или ожидался 100% идеальный результат?

Рейтинг сообщения: +1, отметил(и): klerk
2 2 4
BL@CK DE@TH
Lieutenant Colonel
Next rank: - Colonel - after 202 pointsМодератор форума
3838

Doom Rate: 1.37

Posts quality: +2155
Ссылка на пост №68 Отправлено: 28.06.25 16:48:48
lafoxxx [B0S], хорошо получилась грудь и провода на животе, а мелкие детали, голова и конечности не очень. Думаю, из-за мелкого разрешения и пиксельности нейросеть просто не поняла, где и какие детали прорисовывать. А в целом, да, неплохо.

Рейтинг сообщения: +1, отметил(и): klerk
1 2 1
VladGuardian
- UAC Commissar -
Next rank: = UAC Commissar = after 321 points
5979

Doom Rate: 1.33

Posts quality: +2180
Ссылка на пост №69 Отправлено: 29.06.25 06:47:16
Не знаю, как там грудь и волосы на груди кибердемона,
но свеженаписанные на ютубе песни Виктора Цоя мне нравятся! :)

Ощутимо хуже и невнятнее оригинала, но что-то в этом есть! - особенно когда идёт на фоне анимированной картинки!
Оригинал всё же лучше, я не совсем сумасшедший, чтобы не признать это...
Многие винили Цоя в том, что он "о чём вижу, о том пою", но там был простой чёткий смысл, плюс с мистическим отливом,
а нейросеть часто генерирует "топчащуюся на месте смысловую мутотень". (нет "вектора движения мысли", что производит удручающее впечатление на слушателя)

Характерный пример AI-топтания: https://www.youtube.com/watch?v=PHqOs0-XELE

Рейтинг сообщения: +1, отметил(и): klerk
4 17 23
+Ku6EPyXOBEPTKA+
= Major =
Next rank: Lieutenant Colonel after 221 pointsМодератор форума
3069

Doom Rate: 2.05

Posts quality: +1528
Ссылка на пост №70 Отправлено: 29.06.25 11:30:48
BL@CK DE@TH пишет:
Попробовал нейросеть Hunyuan 3D, которая конвертирует фотографии и изображения в трёхмерные модели.

Не без косяков, но вполне годный инструмент. Ради лола с небольшой приправкой в блендере:




Прям просится распечатать на 3д принтере...

Рейтинг сообщения: +6, отметил(и): BL@CK DE@TH, klerk, VladGuardian, Taw Tu'lki, SilverMiner, AndrewMRX
2 1 7
Taw Tu'lki
= Captain =
Next rank: - Major - after 133 points
2507

Doom Rate: 1.35

Posts quality: +1149
Ссылка на пост №71 Отправлено: 29.06.25 11:37:27
+Ku6EPyXOBEPTKA+
Напомнило мне монстра для Doom2D "Кака с ножками" - Плод брачного союза пинки и какодемона
https://doom2d.org/doom2d_forever/models/index.html

Рейтинг сообщения: +1, отметил(и): klerk
15
klerk
- 2nd Lieutenant -
Next rank: = 2nd Lieutenant = after 128 points
1312

Doom Rate: 1.17

Posts quality: +989
Ссылка на пост №72 Отправлено: 29.06.25 20:05:26
Gemma 3N вышла на Ollama: https://ollama.com/library/gemma3n

Грёбаная печаль заключается в том, что обещанной мультимодальности в открытой версии для Ollama нет - она должна быть в Google AI Studio, которой я до сих пор не пользовался. Я бы подумал, что дело в несовместимости расширения Page Assist и сервера Ollama, но увы - в описании модели указано, что она принимает только текст. Видимо, админы репозитория Ollama сами её урезали, т.к. она не в курсе о том, что теперь не понимает на вход картинки и аудиозаписи. При попытке их отправить она возвращает глюки и просто придумывает всякую дичь на свободную тему, лишь бы ответить. При этом постоянно пытается отвечать по-английски независимо от языка запроса, его у обычной Gemma 3 не наблюдалось (она была более адекватна и пыталась следовать запросу в меру возможностей, чего у версии 3N не наблюдается). Несмотря на это, плюс у неё всё же есть: она научилась разбирать текстовые документы (например, PDF, если там содержится именно текст - сканы не понимает, или же обычный txt). Что касается документов office (doc, xls, docx, xlsx и т.д.) - не принимает и считает файлы повреждёнными. Потенциально можно обойти, выгружая их в PDF и скармливая нейросети так, но возможность сомнительная, полезность - тоже. Хотя в определённых моментах может сгодиться.

Можно комбинировать обычную Gemma 3, если надо распознать картинки или быстро сгенерить текст в ответ на запрос или по поиску в интернете, а для разбора PDF использовать версию 3N. В рамках Ollama на обычном компьютере лучших результатов вряд ли можно добиться. Видимо, в данном случае лучше сменить платформу и попробовать что-то другое помимо Ollama, может быть так и сделаю в июле.

Кстати, Gemma 3N с включенным поиском в интернете тексты пишет сносно, однако если указать явно, что текст требуется на русском, источники будет подбирать на нём же. Иначе скорее всего напишет по-английски. При этом качество текста оказывается не сильно лучше, чем у базовой Gemma 3 (которая может без явного промта сама собрать источники на разных языках, но ответ напишет по-русски, что я считаю круто).

В общем пока так, чуда не случилось. Самое главное, чего я ждал от этой версии: транскрибация аудио и видео в базовом режиме (без сторонних инструментов), это в Ollama и не работает. Картинки тоже не понимает, причём та же обычная Gemma в той же Ollama их понимает отлично. Странная ситуация, но уж как есть. Наблюдаем и тестируем.

На hugginface есть инструкция, как развернуть Gemma 3N на pytorch: https://huggingface.co/docs/transformers/main/model_doc/gemma3n
Делать это мне пока некогда и негде. В питон я особо не врубаюсь, поэтому может позже попробую, но обещать не буду. Вообще я хотел бы запилить сначала Gemma с RAG (по типу агент помощи и техподдержки), но пока не преуспел даже в деле интеграции её с обычным сайтом, так что инструкция для вас как это сделать будет тоже ещё нескоро. Надеюсь, она всё же будет, но если кто-то желает сделать это раньше меня и отписаться здесь - буду премного благодарен!

Рейтинг сообщения: +1, отметил(и): VladGuardian
1 11
Страница 4 из 4Перейти наверх Пред.  1, 2, 3, 4
   Список разделов - Болталка - Нейросети и всё что с ними связано