logo
Technomagix
Technomagix
logo
0
читателей
Technomagix  Technomagix
О проекте Просмотр Уровни подписки Фильтры Статистика Обновления проекта Контакты Поделиться Метки
Все проекты
О проекте
Привет! Меня зовут Никита, я веду блог о нейронках и других технологиях в Telegram и на YouTube.
На спонсоре публикую курс по Stable Diffusion, с оглавлением курса можно ознакомиться в навигационном посте.

Поддержать меня можно криптой:
Btc:
bc1qlc8kr8uy90l82zy9xa8dl2xxs8yvcgz6rl6wyu
Eth (eth)
0×165bcC52732DC5a686C461731f9e7faF0E2e1033
Usdt (trx)
TJHUo325B9DgoaPgC1Bo9RvX5ij1UAyM1k

Публикации, доступные бесплатно
Уровни подписки
Единоразовый платёж

Безвозмездное пожертвование на развитие курса.

Помочь проекту
Новичок 250₽ месяц 2 400₽ год
(-20%)
При подписке на год для вас действует 20% скидка. 20% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Внесите свой вклад в развитие курса по Stable Diffusion.

Оформить подписку
Энтузиаст 500₽ месяц 5 100₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша поддержка поможет совершенствовать и расширять курс. Вы получите доступ к домашним заданиям.

Оформить подписку
Специалист 990₽ месяц 10 098₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша поддержка позволит создавать более глубокий и детализированный контент. Вы получите доступ к домашним заданиям.

Оформить подписку
Эксперт 1 750₽ месяц 17 850₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша щедрая поддержка обеспечит непрерывное улучшение качества курса. Вы получите доступ к домашним заданиям.

Оформить подписку
Меценат 5 000₽ месяц 51 000₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша исключительная поддержка позволит развивать инновационные методы обучения. Вы получите доступ к домашним заданиям.

Оформить подписку
Фильтры
Статистика
Обновления проекта
Поделиться
Читать: 1+ мин
logo Technomagix

Навигация по курсу Stable Diffusion

0.1 Вступление

Часть ‎1.‏ ‎Что ‎такое ‎Stable ‎Diffusion.

1.1. Обзор ‎технологии

1.2 Как‏ ‎создавался ‎Stable‏ ‎Diffusion

1.3 На‏ ‎чьих ‎картинках ‎учился‏ ‎Stable ‎Diffusion?

Часть‏ ‎2. ‎Установка ‎Stable ‎Diffusion‏ ‎Automatic1111

2.1 Устанавливаем‏ ‎программу ‎на‏ ‎ПК

2.2 Аренда ‎сервера‏ ‎для ‎запуска ‎SD

Часть ‎3. ‎Онтология‏ ‎промпта.‏ ‎Семантическая ‎сеть‏ ‎и ‎микросюжетный‏ ‎промпт

3.1 Структура ‎промпта

3.2 Влияние ‎текстовой ‎подсказки

3.3 ⭐ Домашнее ‎задание.‏ ‎Сравниваем‏ ‎типы‏ ‎промптов

Часть ‎4.‏ ‎Prompt-инжиниринг

4.1 Промпт-инжиниринг ‎базовый

4.2 Домашнее‏ ‎задание. ‎Оцениваем‏ ‎эффективность‏ ‎видеокарты

4.3 ⭐Домашнее ‎задание‏ ‎+ ‎тестирование ‎пройденного ‎материала. ‎Улучшаем‏ ‎эстетичность ‎изображения‏ ‎в‏ ‎пару ‎кликов

Часть ‎5.‏ ‎Синтаксис ‎в‏ ‎промпт-инжиниринге

5.1 Синтаксис ‎промпта

5.2 ⭐ Домашнее ‎задание. ‎Упражняемся‏ ‎в‏ ‎синтаксисе

Часть ‎6.‏ ‎Чекпоинты ‎(модели‏ ‎Stable ‎Diffusion)

🚧🚧🚧

Список ‎уроков ‎будет ‎обновляться‏ ‎по‏ ‎мере ‎выхода‏ ‎нового ‎материала…


Читать: 1 мин
logo Technomagix

5.2 | Домашнее задание. Синтаксис в промпте | Курс по Stable Diffusion Automatic

Доступно подписчикам уровня
«Энтузиаст»
Подписаться за 500₽ в месяц

Закрепляем знание синтаксиса.

Читать: 2+ мин
logo Technomagix

4.2 | Домашнее задание. Оцениваем эффективность видеокарты | Курс по Stable Diffusion Automatic

Пока ‎вы‏ ‎только ‎выбираете ‎подходящий ‎промпт, ‎нет‏ ‎необходимости ‎генерировать‏ ‎множество‏ ‎изображений ‎и ‎долго‏ ‎ожидать ‎результата.‏ ‎Когда ‎ваш ‎промпт ‎будет‏ ‎хорошо‏ ‎сформулирован ‎и‏ ‎отредактирован, ‎тогда‏ ‎используйте ‎ресурсы ‎видеокарты ‎на ‎полную‏ ‎мощность.

Из‏ ‎этого ‎урока‏ ‎вы ‎научитесь‏ ‎определять ‎оптимальные ‎настройки ‎генерации ‎для‏ ‎вашей‏ ‎видеокарты.‏ ‎В ‎таблице‏ ‎ниже ‎представлена‏ ‎эффективность ‎видеокарты‏ ‎в‏ ‎зависимости ‎от‏ ‎значения ‎batch ‎size.

Вот ‎какие ‎выводы‏ ‎можно ‎сделать‏ ‎из‏ ‎этой ‎таблицы:

  • Чем ‎больше‏ ‎batch ‎size‏ ‎— ‎тем ‎меньше ‎времени‏ ‎уходит‏ ‎на ‎генерацию‏ ‎одной ‎картинки.
  • При‏ ‎batch ‎size ‎= ‎4 ‎достигается‏ ‎оптимальное‏ ‎время ‎генерации.‏ ‎Дальнейшее ‎увеличение‏ ‎batch ‎size ‎незначительно ‎сокращает ‎время‏ ‎генерации‏ ‎(на‏ ‎одну ‎картинку).
  • После‏ ‎batch ‎size‏ ‎= ‎6‏ ‎сокращения‏ ‎не ‎происходит‏ ‎совсем ‎(значения ‎колеблются ‎в ‎пределах‏ ‎погрешности).

Проведите ‎такой‏ ‎же‏ ‎тест ‎на ‎своём‏ ‎компьютере.


Домашнее ‎задание‏ ‎№ ‎1. ‎Оцените ‎возможности‏ ‎своей‏ ‎видеокарты

Откройте ‎таблицу и‏ ‎создайте ‎её‏ ‎копию. ‎Для ‎этого ‎в ‎верхнем‏ ‎углу‏ ‎таблицы ‎нажмите‏ ‎«Файл» ‎->‏ ‎«Создать ‎копию». ‎Копия ‎этой ‎таблицы‏ ‎сохранилась‏ ‎на‏ ‎вашем ‎гугл-диске,‏ ‎теперь ‎вы‏ ‎можете ‎редактировать‏ ‎её.

Вернитесь‏ ‎к ‎SD‏ ‎и ‎выполните ‎последовательность ‎действий:

1. Выставьте ‎batch‏ ‎size ‎=‏ ‎1;

2. Сгенерируйте‏ ‎картинку ‎размером ‎512×512;

3. Запишите‏ ‎длительность ‎генерации‏ ‎в ‎таблицу. ‎Длительность ‎отображена‏ ‎под‏ ‎генерацией ‎в‏ ‎строке ‎Time‏ ‎taken;

4. Увеличьте ‎значение ‎batch ‎size на ‎+1 и‏ ‎повторите‏ ‎шаги ‎2‏ ‎и ‎3.‏ ‎Продолжайте ‎увеличивать ‎bach ‎size пока ‎он‏ ‎не‏ ‎станет‏ ‎равен ‎8.

Чем‏ ‎больше ‎объём‏ ‎VRAM ‎у‏ ‎видеокарты,‏ ‎тем ‎большее‏ ‎количество ‎изображений ‎можно ‎генерировать ‎одновременно.‏ ‎Сообщение ‎«OutOfMemoryError:‏ ‎CUDA‏ ‎out ‎of ‎memory»‏ ‎ указывает ‎на‏ ‎то, ‎что ‎видеокарта ‎достигла‏ ‎своего‏ ‎предела ‎возможностей.‏ ‎Это ‎поможет‏ ‎вам ‎определить ‎оптимальное ‎число ‎изображений‏ ‎для‏ ‎одновременной ‎генерации‏ ‎картинок ‎размером‏ ‎512×512 ‎пикселей.

Повторите ‎эксперимент ‎с ‎чекпоинтом‏ ‎SDXL‏ ‎и‏ ‎разрешением ‎1024×1024‏ ‎пикселей. ‎Оптимальное‏ ‎значение ‎batch‏ ‎size будет‏ ‎отличаться.


Далее: ‎Домашнее‏ ‎задание ‎+ ‎тестирование ‎пройденного ‎материала.‏ ‎Улучшаем ‎эстетичность‏ ‎изображения‏ ‎в ‎пару ‎кликов.

Смотреть: 18+ мин
logo Technomagix

4.1 | Промпт-инжиниринг базовый | Курс по Stable Diffusion Automatic


Сэмплеры

Из ‎видео‏ ‎вы ‎кое-что ‎узнали ‎про ‎сэмплеры,‏ ‎теперь ‎посмотрим‏ ‎какой‏ ‎из ‎них ‎самый‏ ‎лучший.

График ‎показывает‏ ‎относительное ‎время ‎генерации ‎при‏ ‎использовании‏ ‎разных ‎сэмплеров.‏ ‎Чем ‎меньше‏ ‎столбик ‎на ‎графике, ‎тем ‎быстрее‏ ‎будет‏ ‎генерация.

Посмотрите ‎на‏ ‎ещё ‎один‏ ‎пример ‎того ‎как ‎картинка ‎изменяется‏ ‎при‏ ‎изменении‏ ‎Seed ‎и‏ ‎сэмплера.

Рекомендую ‎использовать‏ ‎сэмплер ‎DPM++‏ ‎2M. Он‏ ‎подходит ‎для‏ ‎фотореалистичных ‎и ‎творческих ‎генераций. ‎С‏ ‎его ‎помощью‏ ‎достаточно‏ ‎20-30 ‎шагов ‎генерации‏ ‎для ‎получения‏ ‎красивых ‎картинок. ‎Дальнейшее ‎увеличение‏ ‎количества‏ ‎шагов ‎увеличит‏ ‎время ‎генерации,‏ ‎но ‎не ‎сделает ‎картинку ‎лучше.

В‏ ‎конце‏ ‎статьи ‎вы‏ ‎найдёте ‎ссылки‏ ‎на ‎скачивание ‎больших ‎таблиц ‎с‏ ‎примерами‏ ‎того‏ ‎как ‎CFG‏ ‎и ‎Step‏ ‎влияет ‎на‏ ‎сэмплеры.‏ ‎Картинки ‎слишком‏ ‎огромные ‎и ‎не ‎вмещаются ‎на‏ ‎сайт.


Негативный ‎промпт

Примеры‏ ‎негативного‏ ‎промпта:

  • cropped, ‎lowres, ‎poorly‏ ‎drawn ‎face,‏ ‎out ‎of ‎frame, ‎poorly‏ ‎drawn‏ ‎hands, ‎blurry,‏ ‎bad ‎art,‏ ‎blurred, ‎text, ‎watermark, ‎disfigured, ‎deformed,‏ ‎closed‏ ‎eyes
  • deformed, ‎blurry,‏ ‎bad ‎anatomy,‏ ‎disfigured, ‎poorly ‎drawn ‎face, ‎mutation,‏ ‎mutated,‏ ‎extra_limb,‏ ‎ugly, ‎poorly‏ ‎drawn ‎hands,‏ ‎two ‎heads,‏ ‎gross,‏ ‎mutilated, ‎disgusting,‏ ‎horrible, ‎scary, ‎evil, ‎old
  • lowres, ‎text,‏ ‎error, ‎cropped,‏ ‎worst‏ ‎quality, ‎low ‎quality,‏ ‎jpeg ‎artifacts,‏ ‎ugly, ‎duplicate, ‎morbid, ‎mutilated,‏ ‎out‏ ‎of ‎frame,‏ ‎extra ‎fingers,‏ ‎mutated ‎hands, ‎poorly ‎drawn ‎hands,‏ ‎poorly‏ ‎drawn ‎face,‏ ‎mutation, ‎deformed,‏ ‎blurry, ‎dehydrated, ‎bad ‎anatomy, ‎bad‏ ‎proportions,‏ ‎extra‏ ‎limbs, ‎cloned‏ ‎face, ‎disfigured,‏ ‎gross ‎proportions,‏ ‎malformed‏ ‎limbs, ‎missing‏ ‎arms, ‎missing ‎legs, ‎extra ‎arms,‏ ‎extra ‎legs,‏ ‎fused‏ ‎fingers, ‎too ‎many‏ ‎fingers, ‎long‏ ‎neck

Не ‎обязательно ‎использовать ‎все‏ ‎слова‏ ‎из ‎этих‏ ‎примеров. ‎Оставьте‏ ‎только ‎только ‎то, ‎что ‎требуется‏ ‎вам‏ ‎в ‎данный‏ ‎момент.

Негативный ‎промпт‏ ‎для ‎фотореалистичных ‎генераций:

  • unrealistic, ‎saturated, ‎high‏ ‎contrast,‏ ‎big‏ ‎nose, ‎painting,‏ ‎drawing, ‎sketch,‏ ‎cartoon, ‎anime,‏ ‎manga,‏ ‎render, ‎CG,‏ ‎3d, ‎watermark, ‎signature, ‎label


Step ‎(шаги‏ ‎генерации)


CFG

По ‎умолчанию‏ ‎оставляйте‏ ‎CFG ‎= ‎7.‏ ‎Для ‎создания‏ ‎фотореалистичных ‎картинок ‎уменьшайте ‎CFG‏ ‎до‏ ‎3-4.

Пример ‎влияния‏ ‎CFG ‎на‏ ‎разных ‎сэмплерах:

https://drive.google.com/file/d/1Yyf7A3UbXVWuAtkkPHc2Ya-fqr4lYkij/view?usp%3Dsharing


Ниже ‎есть ‎ссылки ‎на‏ ‎полезные‏ ‎материалы: ‎модификаторы,‏ ‎стили ‎и‏ ‎различные ‎примеры ‎генераций ‎при ‎разных‏ ‎настройках.


Далее:‏ ‎Домашнее‏ ‎задание. ‎Оцениваем‏ ‎оптимальные ‎настройки‏ ‎для ‎серийной‏ ‎генерации‏ ‎картинок.

Читать: 1+ мин
logo Technomagix

3.3 | Домашнее задание. Сравниваем типы промптов | Курс по Stable Diffusion Automatic

Доступно подписчикам уровня
«Энтузиаст»
Подписаться за 500₽ в месяц

Закрепляем пройденный материал

Смотреть: 8+ мин
logo Technomagix

3.1 | Структура промпта | Курс по Stable Diffusion

(⓿_⓿) Внимание! ‎Примеры‏ ‎на ‎видео ‎созданы ‎в ‎ранних‏ ‎версиях ‎Stable‏ ‎Diffusion.‏ ‎Современные ‎чекпоинты ‎сгенерируют‏ ‎результат ‎с‏ ‎более ‎высокой ‎эстетической ‎оценкой.‏ ‎Общая‏ ‎суть ‎промптинга‏ ‎при ‎этом‏ ‎остаётся ‎неименной. ‎С ‎видами ‎чекпоинтов‏ ‎познакомимся‏ ‎в ‎одном‏ ‎из ‎следующих‏ ‎уроков.

Создание ‎промптов ‎для ‎Stable ‎Diffusion‏ ‎является‏ ‎ключевым‏ ‎этапом ‎в‏ ‎работе ‎с‏ ‎нейросетями ‎и‏ ‎моделями‏ ‎text2image. ‎Эффективные‏ ‎промпты ‎позволяют ‎добиться ‎высококачественных ‎результатов‏ ‎и ‎реализовать‏ ‎творческие‏ ‎замыслы. ‎Промпт ‎—‏ ‎это ‎текстовый‏ ‎запрос, ‎который ‎формулируется ‎таким‏ ‎образом,‏ ‎чтобы ‎нейросеть‏ ‎могла ‎его‏ ‎понять ‎и ‎воплотить ‎в ‎изображение.‏ ‎В‏ ‎промпте ‎указывается‏ ‎тип ‎(фотография,‏ ‎иллюстрация, ‎скетч ‎и ‎т.п), ‎субъект‏ ‎(то,‏ ‎что‏ ‎должно ‎быть‏ ‎изображено), ‎его‏ ‎действия ‎или‏ ‎окружение,‏ ‎а ‎также‏ ‎ключевые ‎слова, ‎определяющие ‎стиль ‎и‏ ‎детали. ‎Важно‏ ‎помнить,‏ ‎что ‎расположение ‎слов‏ ‎в ‎промпте‏ ‎влияет ‎на ‎итоговую ‎генерацию:‏ ‎чем‏ ‎ближе ‎слово‏ ‎к ‎началу,‏ ‎тем ‎больше ‎его ‎влияние. ‎Для‏ ‎создания‏ ‎эффективных ‎промптов‏ ‎можно ‎использовать‏ ‎различные ‎подходы: ‎самостоятельное ‎написание, ‎использование‏ ‎конструкторов‏ ‎промптов‏ ‎или ‎оптимизационных‏ ‎инструментов.


📃 Сайты ‎с‏ ‎ключевыми ‎модификаторами:

Посмотрите‏ ‎как‏ ‎модификаторы ‎влияют‏ ‎на ‎генерируемое ‎изображение.


📃 Переводчики

Переводчики ‎помогут ‎перевести‏ ‎промпт ‎на‏ ‎английский‏ ‎языке.

  • Deepl ‎— рекомендую ‎не‏ ‎только ‎для‏ ‎использования ‎в ‎браузере, ‎но‏ ‎и‏ ‎бесплатную ‎версию‏ ‎программы ‎для‏ ‎переводов ‎текста ‎прямо ‎в ‎Windows
  • Google‏ ‎translate
  • Яндекс‏ ‎translate

🖐На ‎практике‏ ‎микросюжетные ‎промпты‏ ‎не ‎используются, ‎поскольку ‎современные ‎нейросети‏ ‎плохо‏ ‎понимают‏ ‎контекст. ‎В‏ ‎лучшем ‎случае‏ ‎нейросеть ‎проигнорирует‏ ‎слова,‏ ‎а ‎в‏ ‎худшем ‎— ‎добавит ‎в ‎изображение‏ ‎нежелательные ‎искажения.‏ ‎Подробности‏ ‎вы ‎найдете ‎в‏ ‎следующем ‎уроке.



Далее:‏ ‎3.2 ‎Влияние ‎текстовой ‎подсказки

Смотреть: 9 мин
logo Technomagix

2.1 | Устанавливаем Stable Diffusion Automatic1111 на свой ПК | Курс по Stable Diffusion Automatic

Если ‎программа‏ ‎у ‎вас ‎уже ‎установлена ‎—‏ ‎переходите ‎к‏ ‎третьей‏ ‎части ‎курса.

Есть ‎два‏ ‎основных ‎способа‏ ‎запуска ‎Stable ‎Diffusion ‎Automatic1111:‏ ‎Запуск‏ ‎на ‎своём‏ ‎компьютере ‎и‏ ‎аренда ‎мощного ‎сервера. ‎Выбор ‎зависит‏ ‎от‏ ‎ваших ‎потребностей‏ ‎и ‎возможностей.‏ ‎Установка ‎на ‎собственный ‎ПК ‎обеспечивает‏ ‎больший‏ ‎контроль‏ ‎и ‎гибкость,‏ ‎но ‎требует‏ ‎мощного ‎оборудования.‏ ‎Аренда‏ ‎сервера ‎может‏ ‎быть ‎более ‎доступным ‎вариантом, ‎но‏ ‎менее ‎гибким‏ ‎и‏ ‎часто ‎платным.


1 способ. ‎Установка‏ ‎на ‎свой‏ ‎компьютер

Минимальные ‎требования:

  • Видеокарта ‎с ‎объемом‏ ‎видеопамяти‏ ‎не ‎менее‏ ‎4 ‎ГБ‏ ‎(для ‎комфортной ‎работы ‎рекомендуется ‎6‏ ‎ГБ‏ ‎и ‎более)
  • Оперативная‏ ‎память: ‎рекомендуется‏ ‎16 ‎ГБ
  • Не ‎менее ‎100 ‎ГБ‏ ‎свободного‏ ‎места‏ ‎на ‎диске‏ ‎для ‎программы‏ ‎и ‎сгенерированных‏ ‎изображений
  • Желательно‏ ‎иметь ‎твердотельную‏ ‎память ‎(SSD). ‎На ‎устаревших ‎HDD‏ ‎загрузка ‎программы‏ ‎будет‏ ‎длиться ‎дольше.

Плюсы:

  • ✅ Бесплатное ‎и‏ ‎безлимитное ‎использование
  • ✅ Гибкая‏ ‎настройка ‎плагинов ‎и ‎моделей‏ ‎под‏ ‎свои ‎нужды

Минусы:

  • ❌ Необходим‏ ‎мощный ‎ПК
  • ❌ Производитель‏ ‎видеокарты ‎имеет ‎важное ‎значение. ‎Видеокарты‏ ‎NVIDIA‏ ‎лучше ‎подходят‏ ‎для ‎работы‏ ‎с ‎нейросетями, ‎так ‎как ‎большинство‏ ‎программ‏ ‎оптимизировано‏ ‎под ‎них.‏ ‎Запуск ‎Stable‏ ‎Diffusion ‎на‏ ‎видеокартах‏ ‎других ‎производителей‏ ‎сложнее, ‎а ‎генерация ‎будет ‎медленнее‏ ‎и ‎функционал‏ ‎ограничен.


Начинаем‏ ‎установку

☝️Установите ‎Stable ‎Diffusion‏ ‎Automatic1111 ‎одним‏ ‎из ‎нескольких ‎способов. ‎Перед‏ ‎установкой‏ ‎SD ‎обязательно‏ ‎нужно ‎установить‏ ‎Git и ‎Python ‎версии ‎3.10.9. Если ‎нужна‏ ‎помощь‏ ‎в ‎установке‏ ‎git ‎и‏ ‎python ‎— ‎смотрите ‎youtube ‎инструкцию.

  1. Портативная‏ ‎версия‏ ‎(стандартная).‏ ‎Скачайте ‎архив‏ ‎«sd.webui.zip» и ‎разархивируйте‏ ‎его. ‎Удалите‏ ‎папку‏ ‎«venv». ‎Далее‏ ‎запустите ‎файл ‎с ‎названием ‎«webui-user.bat».‏ ‎Дождитесь ‎пока‏ ‎скачаются‏ ‎все ‎необходимые ‎файлы‏ ‎(займёт ‎от‏ ‎15 ‎минут ‎до ‎нескольких‏ ‎часов).‏ ‎Всё. ‎Программой‏ ‎можно ‎пользоваться.‏ ‎Детальная ‎инструкция ‎есть ‎здесь;
  2. Портативная ‎версия‏ ‎(оптимизированная‏ ‎«Forge») ‎—‏ ‎рекомендуемый ‎способ‏ ‎для ‎тех ‎у ‎кого ‎слабая‏ ‎видеокарта‏ ‎(менее‏ ‎8гб). ‎Эта‏ ‎версия ‎программы‏ ‎совместима ‎не‏ ‎со‏ ‎всеми ‎сторонними‏ ‎плагинами ‎— ‎такова ‎цена ‎оптимизации‏ ‎программного ‎кода.‏ ‎Перейдите‏ ‎по ‎ссылке и ‎нажмите‏ ‎кнопку ‎«>>>‏ ‎Click ‎Here ‎to ‎Download‏ ‎One-Click‏ ‎Package<<<». Начнется ‎скачивание‏ ‎архива. ‎Извлеките‏ ‎файлы ‎из ‎скачанного ‎архив ‎в‏ ‎отдельную‏ ‎папку ‎(в‏ ‎названии ‎папки‏ ‎должны ‎быть ‎только ‎английские ‎буквы!).‏ ‎Файл‏ ‎«Update»‏ ‎запускайте ‎время‏ ‎от ‎времени‏ ‎для ‎обновления‏ ‎программы.‏ ‎Файл ‎«Run»‏ ‎для ‎запуска ‎программы.
  3. Обычная ‎установка ‎по‏ ‎youtube ‎инструкции (чуть‏ ‎сложнее‏ ‎предыдущих ‎вариантов);
  4. Есть ‎множество‏ ‎автоматизированных ‎установщиков.‏ ‎Например: ‎Super ‎installer или ‎Stability‏ ‎Matrix. Через‏ ‎них ‎можно‏ ‎установить ‎разные‏ ‎нейронки ‎в ‎пару ‎кликов. ‎Иногда‏ ‎эти‏ ‎установщики ‎глючат‏ ‎— ‎использовать‏ ‎их ‎не ‎рекомендую. ‎Лучше ‎пользоваться‏ ‎проверенными‏ ‎способами.

📃 Полезные‏ ‎ссылки

  • 7-Zip — бесплатный, ‎универсальный‏ ‎архиватор ‎для‏ ‎извлечения ‎файлов‏ ‎из‏ ‎архивов.
  • В ‎Youtube‏ ‎инструкции показаны ‎способы ‎устранения ‎основных ‎ошибок‏ ‎установки. ‎Рекомендую‏ ‎смотреть‏ ‎даже ‎если ‎вы‏ ‎устанавливаете ‎портативную‏ ‎сборку ‎Automatic1111.
  • Проблемы ‎при ‎установке‏ ‎и‏ ‎пути ‎решения (англ.)

💬 Дополнительная‏ ‎важная ‎информация!

  • Папка,‏ ‎в ‎которую ‎вы ‎устанавливаете ‎Stable‏ ‎Diffusion‏ ‎должна ‎иметь‏ ‎в ‎названии‏ ‎только ‎английские ‎буквы!
  • В ‎имени ‎учетной‏ ‎записи‏ ‎пользователя‏ ‎windows ‎должны‏ ‎быть ‎только‏ ‎английские ‎буквы.‏ ‎Иначе‏ ‎в ‎процессе‏ ‎установки ‎вы ‎получите ‎ошибку ‎exit‏ ‎code ‎3.
  • В‏ ‎процессе‏ ‎установки ‎Stable ‎Diffusion‏ ‎будут ‎скачиваться‏ ‎файлы ‎библиотек, ‎если ‎у‏ ‎вас‏ ‎медленный ‎интернет,‏ ‎то ‎установка‏ ‎займёт ‎несколько ‎часов.
  • После ‎установки ‎программы‏ ‎очистите‏ ‎жёсткий ‎диск‏ ‎от ‎ненужных‏ ‎файлов. ‎Они ‎лежат ‎в ‎папке‏ ‎«c:\Users\ИМЯ_ПОЛЬЗОВАТЕЛЯ\AppData\Local\pip\» (у‏ ‎меня‏ ‎папка ‎весила‏ ‎7гб).
  • Одновременно ‎можно‏ ‎установить ‎сколько‏ ‎угодно‏ ‎версий ‎программы.



Изменяем‏ ‎иконку ‎программы

Программа ‎запускается ‎через ‎файл‏ ‎webui-user.bat, который ‎не‏ ‎имеет‏ ‎своей ‎иконки, ‎исправим‏ ‎это. ‎Иконки‏ ‎для ‎скачивания ‎находятся ‎внизу‏ ‎статьи

  1. Удерживая‏ ‎нажатой ‎клавишу‏ ‎Alt, ‎перетащите‏ ‎webui-user.bat на ‎рабочий ‎стол.
  2. Щелкните ‎по ‎файлу‏ ‎правой‏ ‎кнопкой ‎мыши‏ ‎=> ‎свойства
  3. Ярлык,‏ ‎там ‎есть ‎«Сменить ‎значок…», ‎нажмите‏ ‎на‏ ‎него‏ ‎и ‎выберите‏ ‎соответствующий ‎файл‏ ‎значка, ‎который‏ ‎вы‏ ‎скачали


Изменяем ‎внешний‏ ‎вид ‎программы

  • Для ‎изменения ‎цветовой ‎темы‏ ‎программы ‎перейдите‏ ‎в‏ ‎настройки ‎программы: ‎«Settings»‏ ‎-> ‎«User‏ ‎interface» ‎-> ‎«Gradio ‎theme»‏ ‎->‏ ‎выберите ‎тему.
  • Сохраните‏ ‎настройки ‎и‏ ‎перезагрузите ‎программу: ‎Apply ‎settings» ‎->‏ ‎«Reload‏ ‎UI».
1


УСТРАНЕНИЕ ‎ОШИБОК‏ ‎И ‎ОПТИМИЗАЦИЯ‏ ‎ПРОГРАММЫ

❗ Если ‎ошибки ‎возникнут ‎в ‎дальнейшем‏ ‎использовании‏ ‎программы‏ ‎— ‎вернитесь‏ ‎к ‎этому‏ ‎сообщению.

Добавление ‎параметров‏ ‎поможет‏ ‎оптимизировать ‎программу:‏ ‎ускорить ‎генерации ‎или ‎избавиться ‎от‏ ‎ошибок. ‎Полный‏ ‎список‏ ‎параметров есть ‎на ‎официальной‏ ‎странице ‎проекта.‏ ‎Далее ‎я ‎приведу ‎список‏ ‎основных‏ ‎параметров.

Для ‎добавления‏ ‎параметров ‎откройте‏ ‎через ‎блокнот ‎файл ‎«webui-user.bat». ‎Параметры‏ ‎добавляются‏ ‎в ‎конце‏ ‎строки ‎«set‏ ‎COMMANDLINE_ARGS=». ‎Все ‎параметры ‎перечисляются ‎через‏ ‎пробел.‏ ‎Подробнее‏ ‎об ‎этом‏ ‎я ‎рассказывал‏ ‎в ‎видео‏ ‎об‏ ‎установке ‎программы.


➡️ Полезные‏ ‎параметры

--opt-sdp-attention

Уменьшает ‎потребление ‎памяти. ‎Уменьшает ‎время‏ ‎генерации ‎картинки‏ ‎на‏ ‎15-70%. ‎Работает ‎только‏ ‎на ‎видеокартах‏ ‎Nvidia.

--xformers

После ‎выхода ‎torch ‎2.0.0‏ ‎этот‏ ‎параметр ‎считается‏ ‎устаревшим ‎для‏ ‎современных. ‎Вместо ‎этого ‎используйте ‎параметр‏ ‎--opt-sdp-attention.

--autolaunch

Рекомендую‏ ‎использовать. ‎Автоматически‏ ‎открывает ‎веб-страницу‏ ‎в ‎браузере ‎после ‎завершения ‎загрузки‏ ‎программы.

--theme=dark

Включает‏ ‎тёмную‏ ‎тему ‎интерфейса‏ ‎программы.

--api

Не ‎включайте‏ ‎пока ‎в‏ ‎этом‏ ‎нет ‎необходимости.‏ ‎Требуется ‎для ‎некоторых ‎сторонних ‎расширений,‏ ‎которые ‎требуют‏ ‎доступ‏ ‎к ‎интернету.


➡️ Ускоряем ‎генерацию‏ ‎в ‎SDXL

  • Nvidia‏ ‎(12gb+) ‎--xformers
  • Nvidia ‎(8gb) ‎--medvram-sdxl‏ ‎--xformers
  • Nvidia‏ ‎(4gb) ‎--lowvram‏ ‎--xformers
  • AMD ‎(4gb)‏ ‎--lowvram ‎--opt-sub-quad-attention + TAESD ‎в ‎настройках

Читайте ‎так‏ ‎же:‏ ‎Оптимальное ‎использование‏ ‎SDXL ‎·‏ ‎AUTOMATIC1111/stable-diffusion-webui ‎Wiki ‎· ‎GitHub


➡️ Параметры ‎для‏ ‎устранения‏ ‎ошибок

--medvram

Для‏ ‎генераций ‎крупных‏ ‎картинок, ‎либо‏ ‎для ‎видеокарт‏ ‎с‏ ‎менее ‎чем‏ ‎6гб ‎видеопамяти. ‎Увеличивает ‎время ‎генерации!‏ ‎Используйте ‎параметр‏ ‎только‏ ‎при ‎острой ‎необходимости.

--lowvram

Работает‏ ‎как ‎предыдущая‏ ‎настройка, ‎но ‎еще ‎сильнее‏ ‎увеличивает‏ ‎время ‎генерации.‏ ‎Только ‎для‏ ‎самых ‎слабых ‎видеокарт ‎с ‎менее‏ ‎чем‏ ‎4гб ‎видеопамяти

--no-half-vae

Если‏ ‎генерируются ‎чёрные‏ ‎или ‎коричневые ‎квадраты. ‎Сильно ‎увеличивает‏ ‎использование‏ ‎памяти‏ ‎при ‎генерации.

--no-half

Требуется,‏ ‎если ‎у‏ ‎вас ‎проблемы‏ ‎с‏ ‎любой ‎генерацией,‏ ‎такое ‎бывает ‎на ‎16хх ‎серии‏ ‎видеокарт, ‎особенно‏ ‎с‏ ‎SD ‎2.x ‎моделями.


⁉️ Вопросы‏ ‎и ‎ответы

Что‏ ‎делать ‎обладателям ‎видеокарт ‎с‏ ‎низким‏ ‎VRAM? ‎(<=4‏ ‎ГБ)

  • Включите ‎оптимизации‏ ‎с ‎помощью ‎аргументов ‎командной ‎строки,‏ ‎но‏ ‎в ‎жертву‏ ‎придётся ‎принести‏ ‎скорость ‎генерации.
  • Если ‎у ‎вас ‎6‏ ‎ГБ‏ ‎видеопамяти‏ ‎и ‎вы‏ ‎хотите ‎создавать‏ ‎картинки ‎с‏ ‎разрешением‏ ‎512×512 ‎пикселей‏ ‎или ‎больше ‎— ‎используйте ‎параметр‏ ‎--medvram.
  • Если ‎добавление‏ ‎параметра‏ ‎--medvram ‎не ‎помогло,‏ ‎используйте ‎вместо‏ ‎него ‎--lowvram ‎--always-batch-cond-uncond.

Что ‎делать‏ ‎если‏ ‎генерируется ‎черный‏ ‎экран?

  • Причина ‎в‏ ‎том, ‎что ‎некоторые ‎видеокарты ‎не‏ ‎поддерживают‏ ‎«половинную ‎точность»:‏ ‎вместо ‎сгенерированных‏ ‎изображений ‎может ‎появиться ‎зеленый ‎или‏ ‎черный‏ ‎экран.‏ ‎Для ‎решения‏ ‎проблемы ‎используйте‏ ‎параметр ‎--upcast-sampling.
  • Если‏ ‎это‏ ‎не ‎помогло‏ ‎— ‎используйте ‎аргументы ‎--upcast-sampling ‎--precision‏ ‎full ‎--no-half.‏ ‎Эта‏ ‎настройка ‎увеличит ‎потребление‏ ‎VRAM. ‎Для‏ ‎компенсации ‎затраченной ‎VRAM, ‎потребуется‏ ‎включить‏ ‎--medvram.
  • В ‎некоторых‏ ‎случаях ‎ошибка‏ ‎может ‎быть ‎связана ‎с ‎VAE,‏ ‎тогда‏ ‎добавьте ‎параметр‏ ‎--no-half-vae.

Как ‎переустановить‏ ‎программу?

  • Удалите ‎папки ‎`venv` ‎и ‎`repositories`.‏ ‎Далее‏ ‎запустите‏ ‎программу ‎через‏ ‎`webui-user.bat`. ‎Необходимые‏ ‎модули ‎будут‏ ‎скачаны‏ ‎заново.

Часто ‎причиной‏ ‎ошибок ‎становятся ‎расширения ‎программы. ‎Расширения‏ ‎делают ‎члены‏ ‎сообщества‏ ‎любителей ‎Stable ‎Diffusion‏ ‎и ‎не‏ ‎всегда ‎это ‎опытные ‎программисты.‏ ‎Закройте‏ ‎программу, ‎переименуйте‏ ‎папку ‎с‏ ‎расширениями ‎`extensions` ‎— ‎так ‎SD‏ ‎потеряет‏ ‎их ‎и‏ ‎запустится ‎без‏ ‎расширений. ‎Если ‎ошибка ‎программы ‎не‏ ‎повторяется,‏ ‎то‏ ‎начинайте ‎поиск‏ ‎того ‎расширения,‏ ‎которое ‎сломало‏ ‎программу.



Следующая‏ ‎статья ‎№ 2.2 посвящена‏ ‎аренде ‎Stable ‎DIffusion ‎на ‎удаленных‏ ‎серверах. ‎Если‏ ‎вы‏ ‎уже ‎установили ‎программу‏ ‎— ‎переходите‏ ‎к ‎уроку ‎3.1 ‎Структура‏ ‎промпта.

Смотреть: 1+ мин
logo Technomagix

1.3 | На чьих картинках учился Stable Diffusion? | Курс по Stable Diffusion Automatic

Датасет ‎—‏ ‎это ‎набор ‎картинок, ‎на ‎которых‏ ‎обучается ‎нейросеть.‏ ‎В‏ ‎видео ‎я ‎покажу‏ ‎как ‎посмотреть‏ ‎на ‎эти ‎картинки ‎и‏ ‎как‏ ‎среди ‎них‏ ‎найти ‎свои‏ ‎фотографии ‎или ‎рисунки.

📃 Ссылки

Laion ‎5b ‎датасет

Тот‏ ‎самый‏ ‎пост с ‎челленджем‏ ‎на ‎генерацию‏ ‎Чебурашки.


Как ‎корпорации ‎и ‎государства ‎на‏ ‎нас‏ ‎наживаются

При‏ ‎обучении ‎Stable‏ ‎Diffusion ‎версии‏ ‎1.5 ‎использовался‏ ‎общедоступный‏ ‎датасет ‎изображений.‏ ‎Однако ‎большинство ‎компаний, ‎создающих ‎нейросети,‏ ‎например, ‎Midjourney,‏ ‎предпочитают‏ ‎не ‎раскрывать ‎источники‏ ‎данных, ‎использованных‏ ‎для ‎обучения ‎их ‎моделей.‏ ‎Государства‏ ‎тоже ‎не‏ ‎стесняются ‎использовать‏ ‎наши ‎персональные ‎данные ‎для ‎обучения‏ ‎надзирающего‏ ‎«Большого ‎брата»‏ ‎😈

Вы ‎вряд‏ ‎ли ‎сможете ‎с ‎уверенностью ‎сказать,‏ ‎были‏ ‎ли‏ ‎ваши ‎личные‏ ‎фотографии ‎задействованы‏ ‎при ‎обучении‏ ‎нейросети‏ ‎Midjourney. ‎Тем‏ ‎не ‎менее, ‎многие ‎социальные ‎сети‏ ‎и ‎интернет-платформы‏ ‎активно‏ ‎используют ‎пользовательский ‎контент,‏ ‎включая ‎тексты,‏ ‎видео ‎и ‎изображения, ‎для‏ ‎обучения‏ ‎своих ‎нейронных‏ ‎сетей ‎без‏ ‎ведома ‎и ‎согласия ‎авторов.

Происходит ‎ли‏ ‎это‏ ‎с ‎вашим‏ ‎контентом ‎в‏ ‎данный ‎момент? ‎Хотите ‎ли ‎вы,‏ ‎чтобы‏ ‎так‏ ‎было? ‎К‏ ‎сожалению, ‎пользователи‏ ‎зачастую ‎не‏ ‎имеют‏ ‎выбора ‎и‏ ‎возможности ‎проконтролировать ‎этот ‎процесс ‎🕵️

Хотя‏ ‎использование ‎персональных‏ ‎данных‏ ‎для ‎обучения ‎нейронок‏ ‎может ‎вызывать‏ ‎беспокойство ‎с ‎точки ‎зрения‏ ‎приватности,‏ ‎это ‎одновременно‏ ‎является ‎неотъемлемой‏ ‎частью ‎развития ‎технологий ‎искусственного ‎интеллекта.‏ ‎Нейросети‏ ‎обучаются ‎на‏ ‎больших ‎объемах‏ ‎разнообразных ‎данных, ‎и ‎пользовательский ‎контент‏ ‎является‏ ‎ценным‏ ‎источником ‎такой‏ ‎информации.

Компаниям ‎следует‏ ‎быть ‎более‏ ‎прозрачными‏ ‎в ‎отношении‏ ‎своих ‎практик ‎использования ‎данных ‎и‏ ‎предоставлять ‎пользователям‏ ‎возможность‏ ‎сделать ‎осознанный ‎выбор‏ ‎о ‎том,‏ ‎хотят ‎ли ‎они ‎делиться‏ ‎своим‏ ‎контентом ‎для‏ ‎этих ‎целей.


Нейросети‏ ‎— ‎наши ‎суперсилы

Я ‎обрисовал ‎общую‏ ‎информацию‏ ‎о ‎Stable‏ ‎Diffusion, ‎теперь‏ ‎давайте ‎взглянем ‎на ‎эту ‎технологию‏ ‎в‏ ‎более‏ ‎широком ‎контексте.

Согласно‏ ‎теории ‎диффузии‏ ‎инноваций, ‎процесс‏ ‎распространения‏ ‎новых ‎идей‏ ‎и ‎технологий ‎проходит ‎через ‎пять‏ ‎этапов. ‎Нейросети,‏ ‎несомненно,‏ ‎являются ‎важной ‎инновацией,‏ ‎которая ‎затронет‏ ‎все ‎сферы ‎нашей ‎жизни.‏ ‎В‏ ‎данный ‎момент‏ ‎мы ‎находимся‏ ‎на ‎границе ‎между ‎ранними ‎последователями‏ ‎и‏ ‎ранним ‎большинством‏ ‎пользователей ‎этой‏ ‎технологии.

Это ‎одновременно ‎наше ‎преимущество ‎и‏ ‎вызов.‏ ‎Чем‏ ‎раньше ‎мы‏ ‎освоим ‎нейросети,‏ ‎тем ‎больше‏ ‎выгод‏ ‎сможем ‎извлечь‏ ‎из ‎их ‎использования. ‎Однако ‎на‏ ‎ранних ‎этапах‏ ‎порог‏ ‎входа ‎выше, ‎индустрия‏ ‎только ‎формируется,‏ ‎а ‎набор ‎инструментов ‎стремительно‏ ‎меняется.‏ ‎Вот ‎в‏ ‎чем ‎заключается‏ ‎сложность ‎раннего ‎вхождения ‎в ‎новую‏ ‎область.

Сейчас‏ ‎идет ‎конкурентная‏ ‎борьба ‎между‏ ‎разработчиками ‎нейросетей, ‎и ‎мы, ‎как‏ ‎пользователи,‏ ‎получаем‏ ‎многообразие ‎продуктов.‏ ‎Пока ‎на‏ ‎рынке ‎не‏ ‎закрепились‏ ‎монополии, ‎каждый‏ ‎разработчик ‎стремится ‎удовлетворить ‎наши ‎потребности‏ ‎и ‎предоставить‏ ‎новые‏ ‎уникальные ‎возможности.

Тот ‎факт,‏ ‎что ‎вы‏ ‎смотрите ‎этот ‎курс, ‎говорит‏ ‎о‏ ‎том, ‎что‏ ‎вы ‎относитесь‏ ‎к ‎числу ‎тех, ‎кто ‎не‏ ‎хочет‏ ‎оставаться ‎на‏ ‎месте ‎и‏ ‎ищет ‎новые ‎горизонты. ‎Я ‎искренне‏ ‎рад,‏ ‎что‏ ‎вы ‎работаете‏ ‎над ‎собой‏ ‎и ‎обогащаетесь‏ ‎знаниями.

Освоение‏ ‎нейросетей ‎на‏ ‎этом ‎раннем ‎этапе ‎требует ‎усилий,‏ ‎но ‎это‏ ‎также‏ ‎открывает ‎перед ‎нами‏ ‎огромные ‎перспективы.‏ ‎Лет ‎20 ‎назад ‎в‏ ‎резюме‏ ‎было ‎принято‏ ‎писать ‎«Уверенный‏ ‎пользователь ‎ПК». ‎Сейчас ‎это ‎настолько‏ ‎базовая‏ ‎вещь ‎что‏ ‎упоминать ‎об‏ ‎этом ‎в ‎резюме ‎так ‎же‏ ‎нелепо‏ ‎как‏ ‎всерьез ‎заявлять:‏ ‎«Обучен ‎письму‏ ‎и ‎арифметике».

«Уверенный‏ ‎пользователь‏ ‎нейросетей» ‎—‏ ‎вот ‎новый ‎тренд ‎на ‎ближайшие‏ ‎годы! ‎Вместе‏ ‎мы‏ ‎сможем ‎стать ‎частью‏ ‎этой ‎революционной‏ ‎технологии ‎и ‎извлечь ‎максимальную‏ ‎пользу‏ ‎из ‎ее‏ ‎возможностей.


Далее: ‎2.1 Установка‏ ‎Stable ‎Diffusion ‎Automatic1111


Читать: 4+ мин
logo Technomagix

1.2 | Как создавался Stable Diffusion? | Курс по Stable Diffusion Automatic

Как ‎обучаются‏ ‎диффузионные ‎модели

В ‎основе ‎работы ‎Stable‏ ‎Diffusion ‎лежит‏ ‎диффузионная‏ ‎модель ‎машинного ‎обучения.‏ ‎Процесс ‎обучения‏ ‎этой ‎модели ‎начинается ‎с‏ ‎того,‏ ‎что ‎исследователи‏ ‎берут ‎реальные‏ ‎изображения ‎из ‎интернета ‎и ‎искусственно‏ ‎добавляют‏ ‎к ‎ним‏ ‎случайный ‎шум,‏ ‎похожий ‎на ‎помехи ‎на ‎старом‏ ‎телевизоре.‏ ‎Затем‏ ‎нейросеть ‎обучают‏ ‎убирать ‎этот‏ ‎шум ‎и‏ ‎восстанавливать‏ ‎исходное ‎изображение.

На‏ ‎ранних ‎этапах ‎обучения ‎шум ‎добавляется‏ ‎в ‎небольших‏ ‎количествах.‏ ‎Постепенно ‎его ‎уровень‏ ‎повышается, ‎пока‏ ‎в ‎конечном ‎итоге ‎изображение‏ ‎не‏ ‎будет ‎полностью‏ ‎замаскировано ‎случайными‏ ‎помехами. ‎Несмотря ‎на ‎это, ‎нейросеть‏ ‎учится‏ ‎находить ‎в‏ ‎этом ‎хаотичном‏ ‎шуме ‎визуальные ‎образы: ‎людей, ‎предметы,‏ ‎растения‏ ‎и‏ ‎другие ‎объекты.

Наступает‏ ‎момент, ‎когда‏ ‎нейросети ‎показывают‏ ‎картинку,‏ ‎состоящую ‎исключительно‏ ‎из ‎случайного ‎шума, ‎и ‎просят‏ ‎сгенерировать ‎изображение‏ ‎цветка,‏ ‎кота ‎или ‎шаурмы.‏ ‎И ‎удивительным‏ ‎образом ‎нейросеть ‎способна ‎увидеть‏ ‎в‏ ‎этом ‎беспорядочном‏ ‎наборе ‎пикселей‏ ‎искомые ‎объекты, ‎какими ‎бы ‎они‏ ‎ни‏ ‎были. ‎Этот‏ ‎процесс ‎и‏ ‎называется ‎«диффузионной ‎моделью» ‎машинного ‎обучения.

Но‏ ‎на‏ ‎этом‏ ‎возможности ‎нейросети‏ ‎не ‎заканчиваются.‏ ‎Она ‎не‏ ‎только‏ ‎находит ‎образы‏ ‎в ‎шуме, ‎но ‎и ‎постепенно‏ ‎добавляет ‎детали‏ ‎к‏ ‎изображению, ‎шаг ‎за‏ ‎шагом ‎преобразуя‏ ‎хаотичные ‎пиксели ‎в ‎привлекательную‏ ‎и‏ ‎реалистичную ‎картинку.

Чем‏ ‎больше ‎шагов‏ ‎удаления ‎шума ‎— ‎тем ‎лучше‏ ‎становится‏ ‎картинка, ‎но‏ ‎только ‎до‏ ‎некоторого ‎предела, ‎после ‎которого ‎картинка‏ ‎перестаёт‏ ‎улучшаться.‏ ‎Этот ‎процесс‏ ‎занимает ‎от‏ ‎1 ‎секунды‏ ‎до‏ ‎нескольких ‎минут‏ ‎в ‎зависимости ‎от ‎количества ‎шагов‏ ‎удаления ‎шума,‏ ‎размера‏ ‎картинки, ‎мощности ‎компьютера‏ ‎и ‎других‏ ‎параметров.

В ‎рамках ‎этого ‎курса‏ ‎мы‏ ‎сосредоточимся ‎на‏ ‎практическом ‎применении‏ ‎диффузионных ‎моделей, ‎таких ‎как ‎Stable‏ ‎Diffusion.‏ ‎Однако ‎для‏ ‎тех, ‎кто‏ ‎захочет ‎углубиться ‎в ‎технические ‎детали‏ ‎и‏ ‎узнать‏ ‎больше ‎о‏ ‎том, ‎как‏ ‎устроены ‎эти‏ ‎модели,‏ ‎я ‎предоставлю‏ ‎дополнительные ‎материалы ‎и ‎ресурсы.


Секрет ‎ёмкости‏ ‎нейросетей: ‎информация,‏ ‎а‏ ‎не ‎изображения

Задумывались ‎ли‏ ‎вы, ‎сколько‏ ‎изображений ‎может ‎храниться ‎в‏ ‎нейросети‏ ‎весом ‎всего‏ ‎4 ‎гигабайта?‏ ‎Для ‎сравнения, ‎обычный ‎DVD-диск ‎вмещает‏ ‎до‏ ‎4,7 ‎гигабайт‏ ‎данных. ‎Представьте,‏ ‎что ‎у ‎вас ‎на ‎компьютере‏ ‎есть‏ ‎папка‏ ‎с ‎фотографиями,‏ ‎занимающая ‎гигабайты‏ ‎или ‎даже‏ ‎десятки‏ ‎гигабайт. ‎Сколько‏ ‎же ‎реально ‎фотографий ‎может ‎содержаться‏ ‎в ‎такой‏ ‎папке?‏ ‎Тысячи ‎или ‎даже‏ ‎десятки ‎тысяч?

Теперь‏ ‎вопрос: ‎сколько ‎изображений, ‎по‏ ‎вашим‏ ‎предположениям, ‎может‏ ‎быть ‎«упаковано»‏ ‎в ‎нейросеть ‎объемом ‎4 ‎гигабайта?‏ ‎Попробуйте‏ ‎угадать ‎🤔

Правильный‏ ‎ответ ‎может‏ ‎вас ‎удивить: ‎5 ‎миллиардов ‎изображений‏ ‎упаковано‏ ‎в‏ ‎SD1.5! ‎🤯Однако‏ ‎стоит ‎уточнить,‏ ‎что ‎это‏ ‎не‏ ‎полноценные ‎изображения‏ ‎в ‎привычном ‎понимании, ‎а ‎скорее‏ ‎некая ‎информация,‏ ‎описывающая‏ ‎характерные ‎особенности ‎людей,‏ ‎животных, ‎предметов,‏ ‎стилей, ‎художественных ‎техник ‎и‏ ‎многого‏ ‎другого.

Нейросеть ‎не‏ ‎хранит ‎готовые‏ ‎изображения ‎как ‎таковые. ‎Вместо ‎этого‏ ‎она‏ ‎содержит ‎математические‏ ‎представления ‎визуальных‏ ‎концепций, ‎извлеченные ‎из ‎огромного ‎количества‏ ‎обучающих‏ ‎данных.‏ ‎Благодаря ‎этому‏ ‎нейросеть ‎способна‏ ‎генерировать ‎совершенно‏ ‎новые‏ ‎изображения, ‎комбинируя‏ ‎и ‎интерпретируя ‎усвоенные ‎закономерности ‎и‏ ‎паттерны.

Таким ‎образом,‏ ‎4‏ ‎гигабайта ‎данных ‎нейросети‏ ‎эквивалентны ‎информации,‏ ‎содержащейся ‎в ‎миллиардах ‎отдельных‏ ‎изображений,‏ ‎что ‎позволяет‏ ‎создавать ‎практически‏ ‎бесконечное ‎разнообразие ‎новых ‎визуальных ‎композиций.‏ ‎Именно‏ ‎эта ‎способность‏ ‎к ‎генерации‏ ‎уникального ‎контента ‎делает ‎нейросети, ‎такие‏ ‎как‏ ‎Stable‏ ‎Diffusion, ‎столь‏ ‎мощным ‎и‏ ‎революционным ‎инструментом.

1

🧠 Статьи‏ ‎для‏ ‎самых ‎любознательных‏ ‎с ‎углубленным ‎объяснением ‎того, ‎как‏ ‎устроен ‎SD:‏ ‎[рус.] [english‏ ‎1] [english ‎2]. Более ‎сложные‏ ‎технические ‎детали‏ ‎о ‎диффузионных ‎моделях: ‎[english].


Далее.‏ ‎1.3 На‏ ‎чьих ‎картинках‏ ‎учился ‎Stable‏ ‎Diffusion?

Читать: 6+ мин
logo Technomagix

1. 1 | Stable Diffusion: обзор технологии | Курс по Stable Diffusion Automatic

Stable ‎Diffusion‏ ‎был ‎выпущен ‎компанией ‎Stability ‎AI‏ ‎в ‎августе‏ ‎2022‏ ‎года ‎и ‎сразу‏ ‎же ‎приобрел‏ ‎популярность. ‎Для ‎него ‎создано‏ ‎множество‏ ‎плагинов, ‎оболочек,‏ ‎надстроек, ‎генераторов‏ ‎промптов ‎и ‎дополнительных ‎моделей. ‎Чёрт‏ ‎ногу‏ ‎сломит ‎во‏ ‎всём ‎этом‏ ‎многообразии ‎— ‎будем ‎идти ‎по‏ ‎прядку.‏ ‎Начнём‏ ‎с ‎железа.

Требования‏ ‎к ‎оборудованию

Stable‏ ‎Diffusion ‎может‏ ‎работать‏ ‎даже ‎на‏ ‎домашних ‎ПК, ‎оснащенных ‎видеокартой ‎с‏ ‎2 ‎ГБ‏ ‎видеопамяти.‏ ‎Генерация ‎на ‎таком‏ ‎компьютере ‎будет‏ ‎долгой, ‎лучше ‎вовсе ‎не‏ ‎использовать‏ ‎настолько ‎слабые‏ ‎видеокарты ‎и‏ ‎рассмотреть ‎аренду ‎онлайн ‎видеокарты, ‎к‏ ‎этому‏ ‎мы ‎ещё‏ ‎вернёмся ‎чуть‏ ‎позже. ‎6 ‎гигабайт ‎видеопамяти ‎уже‏ ‎приемлемо,‏ ‎но‏ ‎всё ‎ещё‏ ‎мало. ‎Для‏ ‎быстрой ‎и‏ ‎эффективной‏ ‎работы ‎рекомендуется‏ ‎видеокарта ‎с ‎16 ‎ГБ ‎памяти‏ ‎от ‎NVIDIA,‏ ‎это‏ ‎касается ‎не ‎только‏ ‎стейбла, ‎а‏ ‎вообще ‎любых ‎нейронок. ‎Хотите‏ ‎покупать‏ ‎новую ‎видеокарту‏ ‎— ‎берите‏ ‎Nvidia ‎— ‎не ‎ошибетесь. ‎Использование‏ ‎видеокарт‏ ‎других ‎производителей‏ ‎потребует ‎дополнительной‏ ‎настройки.

«У ‎меня ‎лапки, ‎я ‎просто‏ ‎хочу‏ ‎делать‏ ‎картинки ‎и‏ ‎ничего ‎не‏ ‎смыслю ‎в‏ ‎видеокартах».‏ ‎Окей, ‎вот‏ ‎простая ‎инструкция. ‎Просто ‎запустите ‎диспетчер‏ ‎задач ‎и‏ ‎откройте‏ ‎вкладку ‎«производительность».

Альтернативные ‎способы‏ ‎использования

Есть ‎упрощенные‏ ‎способы ‎использовать ‎SD ‎в‏ ‎виде‏ ‎ботов, ‎сайтов,‏ ‎и ‎приложений.‏ ‎Они ‎не ‎требуют ‎установки, ‎но‏ ‎и‏ ‎возможностей ‎там‏ ‎гораздо-гораздо ‎меньше.‏ ‎Например ‎https://www.mage.space/ или ‎https://playground.ai/

Принцип ‎работы

Чекпоинт ‎Stable‏ ‎Diffusion‏ ‎не‏ ‎содержит ‎картинок‏ ‎— ‎это‏ ‎не ‎библиотека‏ ‎и‏ ‎не ‎база‏ ‎знаний. ‎А ‎генерация ‎картинки ‎—‏ ‎не ‎тоже‏ ‎самое‏ ‎что ‎поиск ‎картинки‏ ‎в ‎гугл.‏ ‎Stable ‎Diffusion ‎не ‎создает‏ ‎коллажи‏ ‎из ‎фотографий.‏ ‎SD ‎скорее‏ ‎является ‎подобием ‎глины: ‎как ‎в‏ ‎куске‏ ‎глине ‎нет‏ ‎отдельных ‎рук,‏ ‎ног ‎и ‎голов, ‎так ‎и‏ ‎в‏ ‎Stable‏ ‎Diffusion ‎нет‏ ‎каких-то ‎конкретных‏ ‎частей, ‎но‏ ‎есть‏ ‎потенциальная ‎возможность‏ ‎обрести ‎форму. ‎Конечный ‎результат ‎зависит‏ ‎от ‎мастерства‏ ‎промпт-инженера.‏ ‎От ‎его ‎навыков‏ ‎написания ‎промпта.

Когда‏ ‎я ‎говорю ‎о ‎Stable‏ ‎Diffusion,‏ ‎то ‎имею‏ ‎ввиду ‎триединую‏ ‎систему, ‎состоящую ‎из: ‎языковой ‎модели,‏ ‎диффузионной‏ ‎модели ‎и‏ ‎декодера. ‎В‏ ‎простонародье ‎всё ‎это ‎зовется ‎просто‏ ‎чекпоинтом‏ ‎Stable‏ ‎Diffusion. ‎Да‏ ‎и ‎пофиг‏ ‎как ‎он‏ ‎там‏ ‎устроен, ‎мы‏ ‎рассматриваем ‎стейбл ‎как ‎пользователи ‎и‏ ‎не ‎будем‏ ‎слишком‏ ‎глубоко ‎погружаться ‎в‏ ‎тонкости, ‎но‏ ‎кое-что ‎на ‎курсе ‎я‏ ‎всё‏ ‎же ‎расскажу.‏ ‎Знание ‎базы‏ ‎сделает ‎нас ‎могущественными ‎промпт-шаманами!

Авторские ‎права

Вопрос‏ ‎авторских‏ ‎прав ‎на‏ ‎изображения, ‎сгенерированные‏ ‎с ‎помощью ‎нейронок, ‎остается ‎спорным.‏ ‎В‏ ‎некоторых‏ ‎случаях ‎создатели‏ ‎таких ‎работ‏ ‎могут ‎претендовать‏ ‎на‏ ‎авторские ‎права‏ ‎для ‎коммерческого ‎использования. ‎Однако ‎юридическая‏ ‎практика ‎в‏ ‎этой‏ ‎области ‎еще ‎не‏ ‎устоялась, ‎и‏ ‎иногда ‎суды ‎отказываются ‎признавать‏ ‎авторство‏ ‎за ‎создателями‏ ‎промптов ‎(промпт-инженерами).

Я‏ ‎провёл ‎опрос среди ‎подписчиков ‎своего ‎канала.‏ ‎61%‏ ‎людей ‎не‏ ‎поддержало ‎авторское‏ ‎право ‎на ‎промпт. ‎«За» ‎высказалось‏ ‎20%‏ ‎опрошенных‏ ‎респондентов.

Одна ‎из‏ ‎распространенных ‎точек‏ ‎зрения ‎заключается‏ ‎в‏ ‎том, ‎что‏ ‎Stable ‎Diffusion ‎— ‎это ‎всего‏ ‎лишь ‎инструмент,‏ ‎который‏ ‎выполняет ‎всю ‎работу‏ ‎по ‎генерации‏ ‎изображения, ‎а ‎вклад ‎человека‏ ‎незначителен.‏ ‎Однако ‎то‏ ‎же ‎самое‏ ‎можно ‎сказать ‎и ‎о ‎фотоаппарате.‏ ‎Фотограф‏ ‎нажимает ‎несколько‏ ‎кнопок, ‎а‏ ‎сложный ‎процесс ‎улавливания ‎и ‎преобразования‏ ‎фотонов‏ ‎в‏ ‎пиксели ‎происходит‏ ‎внутри ‎камеры.‏ ‎Фотограф ‎не‏ ‎создает‏ ‎композицию ‎из‏ ‎атомов, ‎а ‎фиксирует ‎существующую ‎реальность.‏ ‎Тем ‎не‏ ‎менее,‏ ‎мы ‎признаем ‎авторские‏ ‎права ‎фотографов‏ ‎на ‎их ‎работы.

Таким ‎образом,‏ ‎можно‏ ‎утверждать, ‎что‏ ‎создатель ‎промпта‏ ‎для ‎Stable ‎Diffusion ‎также ‎вносит‏ ‎творческий‏ ‎вклад, ‎подобно‏ ‎фотографу, ‎который‏ ‎выбирает ‎ракурс, ‎освещение ‎и ‎другие‏ ‎параметры‏ ‎съемки.‏ ‎Генерация ‎изображения‏ ‎с ‎помощью‏ ‎нейросети ‎—‏ ‎это‏ ‎своего ‎рода‏ ‎«фиксация» ‎виртуальной ‎реальности, ‎созданной ‎на‏ ‎основе ‎текстового‏ ‎описания.‏ ‎Следовательно, ‎авторство ‎создателя‏ ‎промпта ‎может‏ ‎быть ‎признано, ‎несмотря ‎на‏ ‎использование‏ ‎автоматизированного ‎инструмента.

Нужно‏ ‎учитывать, ‎что‏ ‎нейронка ‎училась ‎на ‎том, ‎что‏ ‎сделали‏ ‎люди, ‎миллиарды‏ ‎людей. ‎Многие‏ ‎из ‎нас ‎внесли ‎вклад ‎в‏ ‎обучение‏ ‎нейронки,‏ ‎но ‎могут‏ ‎даже ‎не‏ ‎знать ‎об‏ ‎этом.‏ ‎Все ‎мы‏ ‎авторы ‎и ‎учителя ‎для ‎нейронок.‏ ‎Получаем ‎ли‏ ‎мы‏ ‎от ‎этого ‎право‏ ‎на ‎результаты‏ ‎работы ‎нейронных ‎сетей? ‎Что‏ ‎вы‏ ‎думаете ‎об‏ ‎этом?

Особенности ‎генерации

Stable‏ ‎Diffusion ‎имеет ‎ограничения: ‎подвержен ‎социальным‏ ‎предубеждениям,‏ ‎плохо ‎умеет‏ ‎генерировать ‎разборчивый‏ ‎текст, ‎плохо ‎понимают ‎любые ‎языки‏ ‎кроме‏ ‎английского.

Изначально‏ ‎SD ‎был‏ ‎обучен ‎на‏ ‎квадратных ‎изображениях‏ ‎512×512‏ ‎пикселей. ‎Поэтому‏ ‎лучше ‎всего ‎он ‎генерирует ‎картинки‏ ‎с ‎равными‏ ‎пропорциями‏ ‎сторон. ‎При ‎попытке‏ ‎создать ‎прямоугольные‏ ‎изображения ‎с ‎людьми ‎высока‏ ‎вероятность‏ ‎получить ‎«мутантов».‏ ‎Позже ‎мы‏ ‎рассмотрим, ‎как ‎этого ‎избежать.


Читать ‎дальше:‏ ‎1.2 | Как‏ ‎создавался ‎Stable‏ ‎Diffusion?

Подарить подписку

Будет создан код, который позволит адресату получить бесплатный для него доступ на определённый уровень подписки.

Оплата за этого пользователя будет списываться с вашей карты вплоть до отмены подписки. Код может быть показан на экране или отправлен по почте вместе с инструкцией.

Будет создан код, который позволит адресату получить сумму на баланс.

Разово будет списана указанная сумма и зачислена на баланс пользователя, воспользовавшегося данным промокодом.

Добавить карту
0/2048