Sergey Goryushko

+1770
с 2019
314 подписчика
37 подписок

Да добрая половина работ по ИИ на arxiv сразу идет с гитхабом - бери, проверяй на своих запросах, модифицируй под себя. Что-то явный скам (как недавняя модель Reflection), что-то работает шикарно (как Flux) , что-то работает хорошо только в подобранных авторами условиях - все как везде.

Я скорее наоборот офигеваю от того, насколько все открыто и прозрачно, почти под любой запрос с ИИ есть опен-сорс решения. Чаще всего не топовые, но вполне достаточные для личных задач

В год моего рождения вышло несколько хороших квестов. Я правда хз, как в них играть без гайдов

1

Похожа на Марсиль из "Подземелья вкусностей"

1

Nsfw , как всегда, на оф.сайте не доступно. Надо качать себе или ждать пока какой-нибудь Unstable diffusion обновится

1

Мб сделать тебе через Anaconda сделать отдельное виртуальное окружение с нужным питоном? В конфиге в VENV_DIR пропишешь путь до нужного окружения и должно заработать

Еще проще оказалось - https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/10539 . Просто укажи нужную версию в конфиге, если у тебя на машине их несколько

У нас было два фотосета косплея, семьдесят пять утренних шитпостов, 5 невзлетевших лонгов, комментарии, наполовину наполненные шаблонными гачи-мемами, и целое море гифок из корейских фильмов, сосисочных новостей и консольных баталий, а так же милых животных, зашадоубаненных виабушников, ящика с агуша-играми, пинты чистого хейта всего популярного, и 12 раундов смертельной битвы насмерть. Не то, чтобы всё это было категорически необходимо для поездки на завод, но если уж начал писать комменты, то к делу надо подходить серьёзно.

3

Плюсую за предложение попробовать paddle ocr, его реализация на питоне мне понравилась больше всех остальных распознавалок. У него и на C# порт есть - https://github.com/sdcb/PaddleSharp

А так рекомендуют еще https://github.com/open-mmlab/mmocr с моделью https://github.com/open-mmlab/mmocr/blob/main/configs/textrecog/abinet/README.md, но там у готовых моделей только английский вроде; у каких-то моделей еще китайский есть.

1

Самое крутое, что запомнилось из нескольких поездок - подлодка в музее мирового океана. Ощущения сложнопередаваемые - смесь клаустрофобии с уважением, всем рекомендую :)

3

Нужно развидеть на этом стикере красные глаза и рот.
P.S: офигенно получилось!

Troubleshooter: abandoned children - в целом эта корейская тактика терпима по сложности, но у нее есть режим *для мазохистов*, где врагов больше , боссы - сильнее и т.д.
Если в этом режиме еще запускать карту, где надо убить 9 разных боссов и 90+ противников - можно смело потерять полтора часа. Один раз ошибешься/ понадеешься на рандом - начинай заново.
Игра даже предлагает тебе после каждого босса закончить, но это явно не путь самурая

1

Добрый! Для настолько продвинутых вопросов, имхо, лучше уже на самом гитхабе спрашивать, там отличное сообщество.
В Api нет зацепок для вызова скриптов? https://github.com/AUTOMATIC1111/stable-diffusion-webui/discussions/3734

Я почему-то подумал, что фильм связан с циклом *Луна* Йена Макдональда и раскатал губу на новую сай-фай Игру престолов. Да еще и rpg в таком сеттинге, ляпота...
А фильм, оказывается, по собственному сценарию с завязкой про сбор команды по спасению мира с таинственной избранной во главе; ожидания упали обратно до уровня *ничего особого не жду*

1

Я не большой эксперт в обучении, но обычно говорят, что важно качество самих изображений, качество твоих текстовых описаний и что ты хочешь сделать. На конкретного человека хватает от 8 до 50.

Из общих соображений - если у тебя не конкретный персонаж а какой-то класс объектов с характерными признаками - лучше побольше примеров, конечно, что б итоговый результат не был похож на какое-то конкретное изображение из обучающих картинок

1

в Automatic1111 за это отвечает скрипт X/Y promt, ставишь там по X - seed, по Y - checkpoint name

Ты поставил слишком большую версию Питона, нужна чуть постарее) https://www.python.org/downloads/release/python-3106/ (Files- Windows Installer)

попробуй pix2pix модель, если тебе нужны небольшие стилистические изменения. Или depth2img/inpaing модели, если нужны похожие контуры, но другое содержание

1

https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/7717/commits
не у тебя одного)
Как вижу, фикс в откатывании на старую версию fast.api
добавь в конец requirements_versions.txt
строчку
fastapi==0.90.1
и сохрани новый файл

2

Круто, что вообще поднял! Мы тут 3 месяца назад не cмогли вдвоем дойти, как другие onnx-ные сборки на AMD запустить хотя бы.

Просто топ. Как влепить по лайку за каждый экземпляр?
Thorn не думал сделать, раз тебе Destiny заходит?

Апдейт - появился метод pix2pix, который делает прям то, что тебе нужно - и стилизация появится и исходник почти не нарушится. Распишу его в новой части мини-гайда

Раньше был отдельный аддон, сейчас в A1111 встроена вкладка c текстовыми эмбеддингами, гиперсетями и Lora. Нажимаешь на нужный эмбеддинг - нужное слово добавляется в promt.
Но если у тебя кастомная сборка - тыкай авторов своей кастомной сборки, как подрубить Lora, может они в целом не поддерживаются в ней еще :)

1

Еще раз - в этом варианте программы c .pt файлом пока какой-то косяк. Так-то должен работать через Load Concept - выбираешь его и в запросе ставишь * в том месте, где должен быть концепт. Хочешь использовать эмбеддинги сейчас - рекомендую скачать себе https://github.com/AUTOMATIC1111/stable-diffusion-webui и закинуть их в папку embeddings

Считай, что у тебя каждая модель знает, как могут выглядеть слова из запроса на картинках. Загрузка эмбеддинга - что-то вроде загрузки в память модели нового слова, за которым скрывается нужное тебе понятие. Условно - модель по-умолчанию не знает, кто такая Трейсер, а с эмбеддингом она знает, что надо будет отрисовать девушку с визором, остроугольными волосами, и что-то там должно быть в одежде типа оранжевых леггинсов.
На скрине отрисовка без эмбеддинга, если что.

Сорри, много инфы вывалил сразу) Можешь глянуть второй мой гайд, там про все это есть. Коротко:
Можно ничего в негатив не вставлять, но если тебе что-то не нравится в получающихся изображениях - стоит вписать простые ненравящиеся части в него.
Highres.fix в сборке NMKD появляется, когда выбираешь большое разрешение, см скрин
Эмбеддинг - что-то вроде замены большого описания 1 словом, которое понятно нейросети. Что за этим словом стоит - подтягивается как раз из файла-эмбеддинга. В сборке NMKD поддержка этой фичи ограниченная (нужен .bin файл, который хз где брать сейчас) , в реализации Automatic1111 куда лучше устроено.

А почему решил не писать псевдоним косплеерши?
CarryKey, если что