logo
Technomagix
Technomagix
logo
0
читателей
Technomagix  Technomagix
О проекте Просмотр Уровни подписки Фильтры Статистика Обновления проекта Контакты Поделиться Метки
Все проекты
О проекте
Привет! Меня зовут Никита, я веду блог о нейронках и других технологиях в Telegram и на YouTube.
На спонсоре публикую курс по Stable Diffusion, с оглавлением курса можно ознакомиться в навигационном посте.

Поддержать меня можно криптой:
Btc:
bc1qlc8kr8uy90l82zy9xa8dl2xxs8yvcgz6rl6wyu
Eth (eth)
0×165bcC52732DC5a686C461731f9e7faF0E2e1033
Usdt (trx)
TJHUo325B9DgoaPgC1Bo9RvX5ij1UAyM1k

Публикации, доступные бесплатно
Уровни подписки
Единоразовый платёж

Безвозмездное пожертвование на развитие курса.

Помочь проекту
Новичок 250₽ месяц 2 400₽ год
(-20%)
При подписке на год для вас действует 20% скидка. 20% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Внесите свой вклад в развитие курса по Stable Diffusion.

Оформить подписку
Энтузиаст 500₽ месяц 5 100₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша поддержка поможет совершенствовать и расширять курс. Вы получите доступ к домашним заданиям.

Оформить подписку
Специалист 990₽ месяц 10 098₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша поддержка позволит создавать более глубокий и детализированный контент. Вы получите доступ к домашним заданиям.

Оформить подписку
Эксперт 1 750₽ месяц 17 850₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша щедрая поддержка обеспечит непрерывное улучшение качества курса. Вы получите доступ к домашним заданиям.

Оформить подписку
Меценат 5 000₽ месяц 51 000₽ год
(-15%)
При подписке на год для вас действует 15% скидка. 15% основная скидка и 0% доп. скидка за ваш уровень на проекте Technomagix
Доступны сообщения

Ваша исключительная поддержка позволит развивать инновационные методы обучения. Вы получите доступ к домашним заданиям.

Оформить подписку
Фильтры
Статистика
Обновления проекта
Поделиться
Читать: 1+ мин
logo Technomagix

Навигация по курсу Stable Diffusion

0.1 Вступление

Часть ‎1.‏ ‎Что ‎такое ‎Stable ‎Diffusion.

1.1. Обзор ‎технологии

1.2 Как‏ ‎создавался ‎Stable‏ ‎Diffusion

1.3 На‏ ‎чьих ‎картинках ‎учился‏ ‎Stable ‎Diffusion?

Часть‏ ‎2. ‎Установка ‎Stable ‎Diffusion‏ ‎Automatic1111

2.1 Устанавливаем‏ ‎программу ‎на‏ ‎ПК

2.2 Аренда ‎сервера‏ ‎для ‎запуска ‎SD

Часть ‎3. ‎Онтология‏ ‎промпта.‏ ‎Семантическая ‎сеть‏ ‎и ‎микросюжетный‏ ‎промпт

3.1 Структура ‎промпта

3.2 Влияние ‎текстовой ‎подсказки

3.3 ⭐ Домашнее ‎задание.‏ ‎Сравниваем‏ ‎типы‏ ‎промптов

Часть ‎4.‏ ‎Prompt-инжиниринг

4.1 Промпт-инжиниринг ‎базовый

4.2 Домашнее‏ ‎задание. ‎Оцениваем‏ ‎эффективность‏ ‎видеокарты

4.3 ⭐Домашнее ‎задание‏ ‎+ ‎тестирование ‎пройденного ‎материала. ‎Улучшаем‏ ‎эстетичность ‎изображения‏ ‎в‏ ‎пару ‎кликов

Часть ‎5.‏ ‎Синтаксис ‎в‏ ‎промпт-инжиниринге

5.1 Синтаксис ‎промпта

5.2 ⭐ Домашнее ‎задание. ‎Упражняемся‏ ‎в‏ ‎синтаксисе

Часть ‎6.‏ ‎Чекпоинты ‎(модели‏ ‎Stable ‎Diffusion)

🚧🚧🚧

Список ‎уроков ‎будет ‎обновляться‏ ‎по‏ ‎мере ‎выхода‏ ‎нового ‎материала…


Читать: 1 мин
logo Technomagix

5.2 | Домашнее задание. Синтаксис в промпте | Курс по Stable Diffusion Automatic

Доступно подписчикам уровня
«Энтузиаст»
Подписаться за 500₽ в месяц

Закрепляем знание синтаксиса.

Смотреть: 9+ мин
logo Technomagix

5.1 | Синтаксис промпта | Курс по Stable Diffusion Automatic

Хороший ‎синтаксис‏ ‎важен, ‎поскольку ‎он ‎помогает ‎чекпоинту‏ ‎лучше ‎понять‏ ‎ваши‏ ‎намерения ‎и ‎создать‏ ‎более ‎точные‏ ‎и ‎желаемые ‎результаты.


📖 Управление ‎акцентом

Такой‏ ‎подход‏ ‎к ‎изменению‏ ‎акцента ‎является‏ ‎наиболее ‎предпочтительным.

  1. Числом ‎можно ‎тонко ‎настроить‏ ‎влияние‏ ‎акцента.
  2. Удобно ‎использовать‏ ‎не ‎только‏ ‎для ‎увеличения, ‎но ‎и ‎для‏ ‎уменьшения‏ ‎акцента.
  3. Удобно‏ ‎изменять ‎с‏ ‎клавиатуры. ‎Выделяете‏ ‎нужную ‎часть‏ ‎промпта‏ ‎и ‎с‏ ‎зажатой ‎клавишей ‎ctrl ‎нажимаете ‎стрелки‏ ‎клавиатуры ‎вверх‏ ‎или‏ ‎вниз.



📖Альтернативный ‎способ ‎управления‏ ‎акцентом

  • a ‎(word)‏ ‎— ‎увеличит ‎влияние ‎word‏ ‎в‏ ‎1,1 ‎раза
  • a‏ ‎((word)) ‎—‏ ‎увеличит ‎влияние ‎word ‎в ‎1,21‏ ‎раза‏ ‎(= ‎1,1‏ ‎* ‎1,1)
  • a‏ ‎[word] ‎— ‎уменьшит ‎влияние ‎word‏ ‎в‏ ‎1,1‏ ‎раза
  • a ‎(word:‏ ‎1.5) ‎—‏ ‎увеличит ‎влияние‏ ‎word‏ ‎в ‎1,5‏ ‎раза
  • a ‎(word: ‎0.25) ‎— ‎уменьшит‏ ‎влияние ‎word‏ ‎в‏ ‎4 ‎раза ‎(=‏ ‎1 ‎/‏ ‎0,25)
  • a ‎\(word\) ‎— ‎экранирование‏ ‎спецсимволов‏ ‎(в ‎данном‏ ‎случае ‎спецсимволы‏ ‎— ‎это ‎скобки)
  • ТЕКСТ ‎НАБРАННЫЙ ‎КАПСОМ‏ ‎и‏ ‎строчный ‎текст‏ ‎имеют ‎равное‏ ‎влияние

Каждая ‎пара ‎скобок ‎увеличивает ‎вес‏ ‎токена‏ ‎на‏ ‎10%

  • (smile) ‎=‏ ‎(smile: ‎1.1)
  • ((smile))‏ ‎= ‎(smile:‏ ‎1.21)
  • (((smile)))‏ ‎= ‎(smile:‏ ‎1.331)
  • ((((smile)))) ‎= ‎(smile: ‎1.4641)
  • (((((smile)))) ‎=‏ ‎(smile: ‎1.61051)
  • ((((((smile))))))‏ ‎=‏ ‎(smile: ‎1.771561)


📖Подмена/удаление/переключение ‎промпта

☝️Подмена‏ ‎промпта

[from: ‎to:‏ ‎when]

from ‎и ‎to — произвольные ‎тексты,‏ ‎а‏ ‎when ‎— шаг,‏ ‎с ‎которого‏ ‎будет ‎выполнена ‎подмена.

☝️Удаление ‎промпта

[dog|8]

Удалит ‎из‏ ‎промпта‏ ‎слово ‎«dog»‏ ‎на ‎8‏ ‎шаге.

☝️Переключение ‎промпта

[human|bear|pig]

На ‎каждом ‎шаге ‎будет‏ ‎поочерёдно‏ ‎генерироваться‏ ‎только ‎одно‏ ‎слово ‎из‏ ‎списка.


📃 Полезные ‎ссылки



Читать: 1+ мин
logo Technomagix

4.3 | Домашнее задание + тестирование пройденного материала. Улучшаем эстетичность изображения в пару кликов | Курс по Stable Diffusion Automatic

Доступно подписчикам уровня
«Энтузиаст»
Подписаться за 500₽ в месяц

Читать: 2+ мин
logo Technomagix

4.2 | Домашнее задание. Оцениваем эффективность видеокарты | Курс по Stable Diffusion Automatic

Пока ‎вы‏ ‎только ‎выбираете ‎подходящий ‎промпт, ‎нет‏ ‎необходимости ‎генерировать‏ ‎множество‏ ‎изображений ‎и ‎долго‏ ‎ожидать ‎результата.‏ ‎Когда ‎ваш ‎промпт ‎будет‏ ‎хорошо‏ ‎сформулирован ‎и‏ ‎отредактирован, ‎тогда‏ ‎используйте ‎ресурсы ‎видеокарты ‎на ‎полную‏ ‎мощность.

Из‏ ‎этого ‎урока‏ ‎вы ‎научитесь‏ ‎определять ‎оптимальные ‎настройки ‎генерации ‎для‏ ‎вашей‏ ‎видеокарты.‏ ‎В ‎таблице‏ ‎ниже ‎представлена‏ ‎эффективность ‎видеокарты‏ ‎в‏ ‎зависимости ‎от‏ ‎значения ‎batch ‎size.

Вот ‎какие ‎выводы‏ ‎можно ‎сделать‏ ‎из‏ ‎этой ‎таблицы:

  • Чем ‎больше‏ ‎batch ‎size‏ ‎— ‎тем ‎меньше ‎времени‏ ‎уходит‏ ‎на ‎генерацию‏ ‎одной ‎картинки.
  • При‏ ‎batch ‎size ‎= ‎4 ‎достигается‏ ‎оптимальное‏ ‎время ‎генерации.‏ ‎Дальнейшее ‎увеличение‏ ‎batch ‎size ‎незначительно ‎сокращает ‎время‏ ‎генерации‏ ‎(на‏ ‎одну ‎картинку).
  • После‏ ‎batch ‎size‏ ‎= ‎6‏ ‎сокращения‏ ‎не ‎происходит‏ ‎совсем ‎(значения ‎колеблются ‎в ‎пределах‏ ‎погрешности).

Проведите ‎такой‏ ‎же‏ ‎тест ‎на ‎своём‏ ‎компьютере.


Домашнее ‎задание‏ ‎№ ‎1. ‎Оцените ‎возможности‏ ‎своей‏ ‎видеокарты

Откройте ‎таблицу и‏ ‎создайте ‎её‏ ‎копию. ‎Для ‎этого ‎в ‎верхнем‏ ‎углу‏ ‎таблицы ‎нажмите‏ ‎«Файл» ‎->‏ ‎«Создать ‎копию». ‎Копия ‎этой ‎таблицы‏ ‎сохранилась‏ ‎на‏ ‎вашем ‎гугл-диске,‏ ‎теперь ‎вы‏ ‎можете ‎редактировать‏ ‎её.

Вернитесь‏ ‎к ‎SD‏ ‎и ‎выполните ‎последовательность ‎действий:

1. Выставьте ‎batch‏ ‎size ‎=‏ ‎1;

2. Сгенерируйте‏ ‎картинку ‎размером ‎512×512;

3. Запишите‏ ‎длительность ‎генерации‏ ‎в ‎таблицу. ‎Длительность ‎отображена‏ ‎под‏ ‎генерацией ‎в‏ ‎строке ‎Time‏ ‎taken;

4. Увеличьте ‎значение ‎batch ‎size на ‎+1 и‏ ‎повторите‏ ‎шаги ‎2‏ ‎и ‎3.‏ ‎Продолжайте ‎увеличивать ‎bach ‎size пока ‎он‏ ‎не‏ ‎станет‏ ‎равен ‎8.

Чем‏ ‎больше ‎объём‏ ‎VRAM ‎у‏ ‎видеокарты,‏ ‎тем ‎большее‏ ‎количество ‎изображений ‎можно ‎генерировать ‎одновременно.‏ ‎Сообщение ‎«OutOfMemoryError:‏ ‎CUDA‏ ‎out ‎of ‎memory»‏ ‎ указывает ‎на‏ ‎то, ‎что ‎видеокарта ‎достигла‏ ‎своего‏ ‎предела ‎возможностей.‏ ‎Это ‎поможет‏ ‎вам ‎определить ‎оптимальное ‎число ‎изображений‏ ‎для‏ ‎одновременной ‎генерации‏ ‎картинок ‎размером‏ ‎512×512 ‎пикселей.

Повторите ‎эксперимент ‎с ‎чекпоинтом‏ ‎SDXL‏ ‎и‏ ‎разрешением ‎1024×1024‏ ‎пикселей. ‎Оптимальное‏ ‎значение ‎batch‏ ‎size будет‏ ‎отличаться.


Далее: ‎Домашнее‏ ‎задание ‎+ ‎тестирование ‎пройденного ‎материала.‏ ‎Улучшаем ‎эстетичность‏ ‎изображения‏ ‎в ‎пару ‎кликов.

Смотреть: 18+ мин
logo Technomagix

4.1 | Промпт-инжиниринг базовый | Курс по Stable Diffusion Automatic


Сэмплеры

Из ‎видео‏ ‎вы ‎кое-что ‎узнали ‎про ‎сэмплеры,‏ ‎теперь ‎посмотрим‏ ‎какой‏ ‎из ‎них ‎самый‏ ‎лучший.

График ‎показывает‏ ‎относительное ‎время ‎генерации ‎при‏ ‎использовании‏ ‎разных ‎сэмплеров.‏ ‎Чем ‎меньше‏ ‎столбик ‎на ‎графике, ‎тем ‎быстрее‏ ‎будет‏ ‎генерация.

Посмотрите ‎на‏ ‎ещё ‎один‏ ‎пример ‎того ‎как ‎картинка ‎изменяется‏ ‎при‏ ‎изменении‏ ‎Seed ‎и‏ ‎сэмплера.

Рекомендую ‎использовать‏ ‎сэмплер ‎DPM++‏ ‎2M. Он‏ ‎подходит ‎для‏ ‎фотореалистичных ‎и ‎творческих ‎генераций. ‎С‏ ‎его ‎помощью‏ ‎достаточно‏ ‎20-30 ‎шагов ‎генерации‏ ‎для ‎получения‏ ‎красивых ‎картинок. ‎Дальнейшее ‎увеличение‏ ‎количества‏ ‎шагов ‎увеличит‏ ‎время ‎генерации,‏ ‎но ‎не ‎сделает ‎картинку ‎лучше.

В‏ ‎конце‏ ‎статьи ‎вы‏ ‎найдёте ‎ссылки‏ ‎на ‎скачивание ‎больших ‎таблиц ‎с‏ ‎примерами‏ ‎того‏ ‎как ‎CFG‏ ‎и ‎Step‏ ‎влияет ‎на‏ ‎сэмплеры.‏ ‎Картинки ‎слишком‏ ‎огромные ‎и ‎не ‎вмещаются ‎на‏ ‎сайт.


Негативный ‎промпт

Примеры‏ ‎негативного‏ ‎промпта:

  • cropped, ‎lowres, ‎poorly‏ ‎drawn ‎face,‏ ‎out ‎of ‎frame, ‎poorly‏ ‎drawn‏ ‎hands, ‎blurry,‏ ‎bad ‎art,‏ ‎blurred, ‎text, ‎watermark, ‎disfigured, ‎deformed,‏ ‎closed‏ ‎eyes
  • deformed, ‎blurry,‏ ‎bad ‎anatomy,‏ ‎disfigured, ‎poorly ‎drawn ‎face, ‎mutation,‏ ‎mutated,‏ ‎extra_limb,‏ ‎ugly, ‎poorly‏ ‎drawn ‎hands,‏ ‎two ‎heads,‏ ‎gross,‏ ‎mutilated, ‎disgusting,‏ ‎horrible, ‎scary, ‎evil, ‎old
  • lowres, ‎text,‏ ‎error, ‎cropped,‏ ‎worst‏ ‎quality, ‎low ‎quality,‏ ‎jpeg ‎artifacts,‏ ‎ugly, ‎duplicate, ‎morbid, ‎mutilated,‏ ‎out‏ ‎of ‎frame,‏ ‎extra ‎fingers,‏ ‎mutated ‎hands, ‎poorly ‎drawn ‎hands,‏ ‎poorly‏ ‎drawn ‎face,‏ ‎mutation, ‎deformed,‏ ‎blurry, ‎dehydrated, ‎bad ‎anatomy, ‎bad‏ ‎proportions,‏ ‎extra‏ ‎limbs, ‎cloned‏ ‎face, ‎disfigured,‏ ‎gross ‎proportions,‏ ‎malformed‏ ‎limbs, ‎missing‏ ‎arms, ‎missing ‎legs, ‎extra ‎arms,‏ ‎extra ‎legs,‏ ‎fused‏ ‎fingers, ‎too ‎many‏ ‎fingers, ‎long‏ ‎neck

Не ‎обязательно ‎использовать ‎все‏ ‎слова‏ ‎из ‎этих‏ ‎примеров. ‎Оставьте‏ ‎только ‎только ‎то, ‎что ‎требуется‏ ‎вам‏ ‎в ‎данный‏ ‎момент.

Негативный ‎промпт‏ ‎для ‎фотореалистичных ‎генераций:

  • unrealistic, ‎saturated, ‎high‏ ‎contrast,‏ ‎big‏ ‎nose, ‎painting,‏ ‎drawing, ‎sketch,‏ ‎cartoon, ‎anime,‏ ‎manga,‏ ‎render, ‎CG,‏ ‎3d, ‎watermark, ‎signature, ‎label


Step ‎(шаги‏ ‎генерации)


CFG

По ‎умолчанию‏ ‎оставляйте‏ ‎CFG ‎= ‎7.‏ ‎Для ‎создания‏ ‎фотореалистичных ‎картинок ‎уменьшайте ‎CFG‏ ‎до‏ ‎3-4.

Пример ‎влияния‏ ‎CFG ‎на‏ ‎разных ‎сэмплерах:

https://drive.google.com/file/d/1Yyf7A3UbXVWuAtkkPHc2Ya-fqr4lYkij/view?usp%3Dsharing


Ниже ‎есть ‎ссылки ‎на‏ ‎полезные‏ ‎материалы: ‎модификаторы,‏ ‎стили ‎и‏ ‎различные ‎примеры ‎генераций ‎при ‎разных‏ ‎настройках.


Далее:‏ ‎Домашнее‏ ‎задание. ‎Оцениваем‏ ‎оптимальные ‎настройки‏ ‎для ‎серийной‏ ‎генерации‏ ‎картинок.

Читать: 1+ мин
logo Technomagix

3.3 | Домашнее задание. Сравниваем типы промптов | Курс по Stable Diffusion Automatic

Доступно подписчикам уровня
«Энтузиаст»
Подписаться за 500₽ в месяц

Закрепляем пройденный материал

Читать: 5+ мин
logo Technomagix

3.2 | Влияние текстовой подсказки | Курс по Stable Diffusion Automatic

Некоторые ‎слова‏ ‎в ‎промпте ‎влияют ‎сразу ‎на‏ ‎всю ‎картинку,‏ ‎другие‏ ‎изменяют ‎лишь ‎некоторые‏ ‎части. ‎В‏ ‎дальнейших ‎примерах ‎с ‎помощью‏ ‎механизма‏ ‎«перекрестного ‎внимания»‏ ‎вы ‎увидите,‏ ‎как ‎нейронка ‎связывает ‎слова ‎с‏ ‎изображением.

Ears‏ ‎(уши)

В ‎примере‏ ‎выше ‎белым‏ ‎цветом ‎выделены ‎те ‎области, ‎которые‏ ‎Stable‏ ‎Diffusion‏ ‎ассоциирует ‎со‏ ‎словом ‎«ears»‏ ‎(уши). ‎Как‏ ‎видите‏ ‎«ears» ‎изменяет‏ ‎не ‎всю ‎картинку, ‎но ‎преимущественно‏ ‎область ‎морды.‏ ‎На‏ ‎морде ‎у ‎свиньи‏ ‎«ears» ‎проявляется‏ ‎сильнее, ‎чем ‎на ‎морде‏ ‎собаки‏ ‎(могло ‎быть‏ ‎и ‎наоборот).‏ ‎Над ‎животными ‎и ‎под ‎ними‏ ‎маска‏ ‎тёмная, ‎это‏ ‎значит, ‎что‏ ‎нейронка ‎не ‎ассоциирует ‎«ears» ‎с‏ ‎этой‏ ‎частью‏ ‎изображения.


Window ‎(окно)

В‏ ‎этом ‎примере‏ ‎выделены ‎области,‏ ‎которые‏ ‎нейронка ‎ассоциирует‏ ‎со ‎словом ‎«window» ‎(окно). ‎Выделено‏ ‎окно ‎—‏ ‎это‏ ‎логично, ‎но ‎кроме‏ ‎него ‎нейронка‏ ‎«видит» ‎«window» ‎в ‎некоторых‏ ‎других‏ ‎частях ‎изображения,‏ ‎например, ‎справа‏ ‎от ‎свиньи. ‎В ‎этом ‎тоже‏ ‎есть‏ ‎смысл, ‎ведь‏ ‎наличие ‎окна‏ ‎в ‎помещение ‎влияет ‎на ‎то,‏ ‎как‏ ‎выглядят‏ ‎объекты ‎в‏ ‎комнате.


Carpet ‎(ковер)

Нейронка‏ ‎делает ‎акцент‏ ‎на‏ ‎ковре ‎и‏ ‎ещё ‎в ‎нескольких ‎местах.

Мы ‎посмотрели‏ ‎на ‎простые‏ ‎предметы,‏ ‎которые ‎имеют ‎пространственную‏ ‎форму, ‎дальше‏ ‎посмотрим ‎как ‎на ‎нейронку‏ ‎влияют‏ ‎абстрактные ‎слова.


Cool‏ ‎(здорово)

Нейронка ‎не‏ ‎выделяет ‎на ‎этом ‎изображении ‎объект‏ ‎«cool»‏ ‎— ‎потому‏ ‎что ‎его‏ ‎не ‎существует ‎как ‎физического ‎объекта.‏ ‎Локализованных‏ ‎акцентов‏ ‎здесь ‎нет,‏ ‎выделяется ‎всё‏ ‎изображение.


Perfect ‎(идеальный)

Perfect‏ ‎также‏ ‎как ‎cool‏ ‎влияет ‎на ‎всё ‎изображение.


Yes ‎(да)

Как‏ ‎выглядит ‎«да»?‏ ‎Видим,‏ ‎что ‎это ‎слово‏ ‎повлияет ‎на‏ ‎всё ‎изображение, ‎но ‎использовать‏ ‎подобные‏ ‎слова ‎не‏ ‎нужно, ‎они‏ ‎внесут ‎непредсказуемые ‎искажения, ‎которые ‎вероятно‏ ‎ухудшат‏ ‎эстетичность.


Картинки ‎с‏ ‎промптами

Посмотрим ‎несколько‏ ‎примеров ‎генераций ‎созданных ‎при ‎помощи‏ ‎SDXL‏ ‎Прочтите‏ ‎промпты ‎к‏ ‎картинкам ‎и‏ ‎переходите ‎к‏ ‎первому‏ ‎домашнему ‎заданию.

1


1
1
1


Домашнее‏ ‎задание

Домашнее ‎задание позволит ‎вам ‎лучше ‎понять,‏ ‎чем ‎написание‏ ‎промпта‏ ‎отличается ‎от ‎написания‏ ‎обычного ‎текста.


Дальше‏ ‎4.1 Промпт-инжиниринг ‎базовый

Смотреть: 8+ мин
logo Technomagix

3.1 | Структура промпта | Курс по Stable Diffusion

(⓿_⓿) Внимание! ‎Примеры‏ ‎на ‎видео ‎созданы ‎в ‎ранних‏ ‎версиях ‎Stable‏ ‎Diffusion.‏ ‎Современные ‎чекпоинты ‎сгенерируют‏ ‎результат ‎с‏ ‎более ‎высокой ‎эстетической ‎оценкой.‏ ‎Общая‏ ‎суть ‎промптинга‏ ‎при ‎этом‏ ‎остаётся ‎неименной. ‎С ‎видами ‎чекпоинтов‏ ‎познакомимся‏ ‎в ‎одном‏ ‎из ‎следующих‏ ‎уроков.

Создание ‎промптов ‎для ‎Stable ‎Diffusion‏ ‎является‏ ‎ключевым‏ ‎этапом ‎в‏ ‎работе ‎с‏ ‎нейросетями ‎и‏ ‎моделями‏ ‎text2image. ‎Эффективные‏ ‎промпты ‎позволяют ‎добиться ‎высококачественных ‎результатов‏ ‎и ‎реализовать‏ ‎творческие‏ ‎замыслы. ‎Промпт ‎—‏ ‎это ‎текстовый‏ ‎запрос, ‎который ‎формулируется ‎таким‏ ‎образом,‏ ‎чтобы ‎нейросеть‏ ‎могла ‎его‏ ‎понять ‎и ‎воплотить ‎в ‎изображение.‏ ‎В‏ ‎промпте ‎указывается‏ ‎тип ‎(фотография,‏ ‎иллюстрация, ‎скетч ‎и ‎т.п), ‎субъект‏ ‎(то,‏ ‎что‏ ‎должно ‎быть‏ ‎изображено), ‎его‏ ‎действия ‎или‏ ‎окружение,‏ ‎а ‎также‏ ‎ключевые ‎слова, ‎определяющие ‎стиль ‎и‏ ‎детали. ‎Важно‏ ‎помнить,‏ ‎что ‎расположение ‎слов‏ ‎в ‎промпте‏ ‎влияет ‎на ‎итоговую ‎генерацию:‏ ‎чем‏ ‎ближе ‎слово‏ ‎к ‎началу,‏ ‎тем ‎больше ‎его ‎влияние. ‎Для‏ ‎создания‏ ‎эффективных ‎промптов‏ ‎можно ‎использовать‏ ‎различные ‎подходы: ‎самостоятельное ‎написание, ‎использование‏ ‎конструкторов‏ ‎промптов‏ ‎или ‎оптимизационных‏ ‎инструментов.


📃 Сайты ‎с‏ ‎ключевыми ‎модификаторами:

Посмотрите‏ ‎как‏ ‎модификаторы ‎влияют‏ ‎на ‎генерируемое ‎изображение.


📃 Переводчики

Переводчики ‎помогут ‎перевести‏ ‎промпт ‎на‏ ‎английский‏ ‎языке.

  • Deepl ‎— рекомендую ‎не‏ ‎только ‎для‏ ‎использования ‎в ‎браузере, ‎но‏ ‎и‏ ‎бесплатную ‎версию‏ ‎программы ‎для‏ ‎переводов ‎текста ‎прямо ‎в ‎Windows
  • Google‏ ‎translate
  • Яндекс‏ ‎translate

🖐На ‎практике‏ ‎микросюжетные ‎промпты‏ ‎не ‎используются, ‎поскольку ‎современные ‎нейросети‏ ‎плохо‏ ‎понимают‏ ‎контекст. ‎В‏ ‎лучшем ‎случае‏ ‎нейросеть ‎проигнорирует‏ ‎слова,‏ ‎а ‎в‏ ‎худшем ‎— ‎добавит ‎в ‎изображение‏ ‎нежелательные ‎искажения.‏ ‎Подробности‏ ‎вы ‎найдете ‎в‏ ‎следующем ‎уроке.



Далее:‏ ‎3.2 ‎Влияние ‎текстовой ‎подсказки

Читать: 1+ мин
logo Technomagix

2.2 | Арендуем сервер для запуска SD | Курс по Stable Diffusion Automatic

Примеры ‎платных‏ ‎серверов: ‎Google ‎Colab, ‎Paperspace, ‎Runpod.

Плюсы:

  • ✅ Возможность‏ ‎использовать ‎оборудование‏ ‎любой‏ ‎мощности
  • ✅ Есть ‎бесплатные ‎серверы‏ ‎(но ‎их‏ ‎сложно ‎получить)
  • ✅ Серверы ‎доступны ‎даже‏ ‎с‏ ‎телефона

Минусы:

  • ❌ Серверы ‎платные
  • ❌ Необходимо‏ ‎либо ‎каждый‏ ‎раз ‎скачивать ‎файлы ‎для ‎работы,‏ ‎либо‏ ‎оплачивать ‎круглосуточное‏ ‎хранение ‎файлов‏ ‎на ‎сервере
  • ❌ Бесплатные ‎серверы ‎имеют ‎низкую‏ ‎доступность,‏ ‎ограничены‏ ‎по ‎времени‏ ‎использования, ‎часто‏ ‎нет ‎свободных‏ ‎видеокарт
  • ❌ Иногда‏ ‎плагины ‎могут‏ ‎не ‎запускаться ‎на ‎серверах


Аренда ‎сервера‏ ‎для ‎SD‏ ‎в‏ ‎Google ‎Colab.

Способ ‎показанный‏ ‎в ‎видео‏ ‎доступен ‎только ‎для ‎платных‏ ‎пользователей‏ ‎google ‎colab.

❕ После‏ ‎завершения ‎работы‏ ‎в ‎google ‎colab ‎не ‎забудьте‏ ‎нажать‏ ‎на ‎кнопку‏ ‎«отключиться ‎от‏ ‎среды ‎выполнения ‎и ‎удалить ‎её».‏ ‎Это‏ ‎сбережёт‏ ‎вам ‎деньги.


Аренда‏ ‎сервера ‎для‏ ‎SD ‎в‏ ‎PAPERSPACE

Бесплатные‏ ‎сервера ‎больше‏ ‎не ‎доступны. ‎Только ‎платные!


📃 Ссылки

❕ Когда ‎заканчиваете‏ ‎работу‏ ‎на ‎сервере‏ ‎— ‎не‏ ‎забывайте ‎завершать ‎сеанс, ‎чтобы ‎освободить.‏ ‎выданную‏ ‎вам ‎видеокарту.


Аренда‏ ‎сервера ‎для‏ ‎SD ‎в ‎RunPod

RunPod ‎— ‎один‏ ‎самых‏ ‎дешёвых‏ ‎сайтов ‎аренды‏ ‎сервера. ‎Я‏ ‎предпочитаю ‎его‏ ‎остальным‏ ‎сайтам.

Смотреть: 9 мин
logo Technomagix

2.1 | Устанавливаем Stable Diffusion Automatic1111 на свой ПК | Курс по Stable Diffusion Automatic

Если ‎программа‏ ‎у ‎вас ‎уже ‎установлена ‎—‏ ‎переходите ‎к‏ ‎третьей‏ ‎части ‎курса.

Есть ‎два‏ ‎основных ‎способа‏ ‎запуска ‎Stable ‎Diffusion ‎Automatic1111:‏ ‎Запуск‏ ‎на ‎своём‏ ‎компьютере ‎и‏ ‎аренда ‎мощного ‎сервера. ‎Выбор ‎зависит‏ ‎от‏ ‎ваших ‎потребностей‏ ‎и ‎возможностей.‏ ‎Установка ‎на ‎собственный ‎ПК ‎обеспечивает‏ ‎больший‏ ‎контроль‏ ‎и ‎гибкость,‏ ‎но ‎требует‏ ‎мощного ‎оборудования.‏ ‎Аренда‏ ‎сервера ‎может‏ ‎быть ‎более ‎доступным ‎вариантом, ‎но‏ ‎менее ‎гибким‏ ‎и‏ ‎часто ‎платным.


1 способ. ‎Установка‏ ‎на ‎свой‏ ‎компьютер

Минимальные ‎требования:

  • Видеокарта ‎с ‎объемом‏ ‎видеопамяти‏ ‎не ‎менее‏ ‎4 ‎ГБ‏ ‎(для ‎комфортной ‎работы ‎рекомендуется ‎6‏ ‎ГБ‏ ‎и ‎более)
  • Оперативная‏ ‎память: ‎рекомендуется‏ ‎16 ‎ГБ
  • Не ‎менее ‎100 ‎ГБ‏ ‎свободного‏ ‎места‏ ‎на ‎диске‏ ‎для ‎программы‏ ‎и ‎сгенерированных‏ ‎изображений
  • Желательно‏ ‎иметь ‎твердотельную‏ ‎память ‎(SSD). ‎На ‎устаревших ‎HDD‏ ‎загрузка ‎программы‏ ‎будет‏ ‎длиться ‎дольше.

Плюсы:

  • ✅ Бесплатное ‎и‏ ‎безлимитное ‎использование
  • ✅ Гибкая‏ ‎настройка ‎плагинов ‎и ‎моделей‏ ‎под‏ ‎свои ‎нужды

Минусы:

  • ❌ Необходим‏ ‎мощный ‎ПК
  • ❌ Производитель‏ ‎видеокарты ‎имеет ‎важное ‎значение. ‎Видеокарты‏ ‎NVIDIA‏ ‎лучше ‎подходят‏ ‎для ‎работы‏ ‎с ‎нейросетями, ‎так ‎как ‎большинство‏ ‎программ‏ ‎оптимизировано‏ ‎под ‎них.‏ ‎Запуск ‎Stable‏ ‎Diffusion ‎на‏ ‎видеокартах‏ ‎других ‎производителей‏ ‎сложнее, ‎а ‎генерация ‎будет ‎медленнее‏ ‎и ‎функционал‏ ‎ограничен.


Начинаем‏ ‎установку

☝️Установите ‎Stable ‎Diffusion‏ ‎Automatic1111 ‎одним‏ ‎из ‎нескольких ‎способов. ‎Перед‏ ‎установкой‏ ‎SD ‎обязательно‏ ‎нужно ‎установить‏ ‎Git и ‎Python ‎версии ‎3.10.9. Если ‎нужна‏ ‎помощь‏ ‎в ‎установке‏ ‎git ‎и‏ ‎python ‎— ‎смотрите ‎youtube ‎инструкцию.

  1. Портативная‏ ‎версия‏ ‎(стандартная).‏ ‎Скачайте ‎архив‏ ‎«sd.webui.zip» и ‎разархивируйте‏ ‎его. ‎Удалите‏ ‎папку‏ ‎«venv». ‎Далее‏ ‎запустите ‎файл ‎с ‎названием ‎«webui-user.bat».‏ ‎Дождитесь ‎пока‏ ‎скачаются‏ ‎все ‎необходимые ‎файлы‏ ‎(займёт ‎от‏ ‎15 ‎минут ‎до ‎нескольких‏ ‎часов).‏ ‎Всё. ‎Программой‏ ‎можно ‎пользоваться.‏ ‎Детальная ‎инструкция ‎есть ‎здесь;
  2. Портативная ‎версия‏ ‎(оптимизированная‏ ‎«Forge») ‎—‏ ‎рекомендуемый ‎способ‏ ‎для ‎тех ‎у ‎кого ‎слабая‏ ‎видеокарта‏ ‎(менее‏ ‎8гб). ‎Эта‏ ‎версия ‎программы‏ ‎совместима ‎не‏ ‎со‏ ‎всеми ‎сторонними‏ ‎плагинами ‎— ‎такова ‎цена ‎оптимизации‏ ‎программного ‎кода.‏ ‎Перейдите‏ ‎по ‎ссылке и ‎нажмите‏ ‎кнопку ‎«>>>‏ ‎Click ‎Here ‎to ‎Download‏ ‎One-Click‏ ‎Package<<<». Начнется ‎скачивание‏ ‎архива. ‎Извлеките‏ ‎файлы ‎из ‎скачанного ‎архив ‎в‏ ‎отдельную‏ ‎папку ‎(в‏ ‎названии ‎папки‏ ‎должны ‎быть ‎только ‎английские ‎буквы!).‏ ‎Файл‏ ‎«Update»‏ ‎запускайте ‎время‏ ‎от ‎времени‏ ‎для ‎обновления‏ ‎программы.‏ ‎Файл ‎«Run»‏ ‎для ‎запуска ‎программы.
  3. Обычная ‎установка ‎по‏ ‎youtube ‎инструкции (чуть‏ ‎сложнее‏ ‎предыдущих ‎вариантов);
  4. Есть ‎множество‏ ‎автоматизированных ‎установщиков.‏ ‎Например: ‎Super ‎installer или ‎Stability‏ ‎Matrix. Через‏ ‎них ‎можно‏ ‎установить ‎разные‏ ‎нейронки ‎в ‎пару ‎кликов. ‎Иногда‏ ‎эти‏ ‎установщики ‎глючат‏ ‎— ‎использовать‏ ‎их ‎не ‎рекомендую. ‎Лучше ‎пользоваться‏ ‎проверенными‏ ‎способами.

📃 Полезные‏ ‎ссылки

  • 7-Zip — бесплатный, ‎универсальный‏ ‎архиватор ‎для‏ ‎извлечения ‎файлов‏ ‎из‏ ‎архивов.
  • В ‎Youtube‏ ‎инструкции показаны ‎способы ‎устранения ‎основных ‎ошибок‏ ‎установки. ‎Рекомендую‏ ‎смотреть‏ ‎даже ‎если ‎вы‏ ‎устанавливаете ‎портативную‏ ‎сборку ‎Automatic1111.
  • Проблемы ‎при ‎установке‏ ‎и‏ ‎пути ‎решения (англ.)

💬 Дополнительная‏ ‎важная ‎информация!

  • Папка,‏ ‎в ‎которую ‎вы ‎устанавливаете ‎Stable‏ ‎Diffusion‏ ‎должна ‎иметь‏ ‎в ‎названии‏ ‎только ‎английские ‎буквы!
  • В ‎имени ‎учетной‏ ‎записи‏ ‎пользователя‏ ‎windows ‎должны‏ ‎быть ‎только‏ ‎английские ‎буквы.‏ ‎Иначе‏ ‎в ‎процессе‏ ‎установки ‎вы ‎получите ‎ошибку ‎exit‏ ‎code ‎3.
  • В‏ ‎процессе‏ ‎установки ‎Stable ‎Diffusion‏ ‎будут ‎скачиваться‏ ‎файлы ‎библиотек, ‎если ‎у‏ ‎вас‏ ‎медленный ‎интернет,‏ ‎то ‎установка‏ ‎займёт ‎несколько ‎часов.
  • После ‎установки ‎программы‏ ‎очистите‏ ‎жёсткий ‎диск‏ ‎от ‎ненужных‏ ‎файлов. ‎Они ‎лежат ‎в ‎папке‏ ‎«c:\Users\ИМЯ_ПОЛЬЗОВАТЕЛЯ\AppData\Local\pip\» (у‏ ‎меня‏ ‎папка ‎весила‏ ‎7гб).
  • Одновременно ‎можно‏ ‎установить ‎сколько‏ ‎угодно‏ ‎версий ‎программы.



Изменяем‏ ‎иконку ‎программы

Программа ‎запускается ‎через ‎файл‏ ‎webui-user.bat, который ‎не‏ ‎имеет‏ ‎своей ‎иконки, ‎исправим‏ ‎это. ‎Иконки‏ ‎для ‎скачивания ‎находятся ‎внизу‏ ‎статьи

  1. Удерживая‏ ‎нажатой ‎клавишу‏ ‎Alt, ‎перетащите‏ ‎webui-user.bat на ‎рабочий ‎стол.
  2. Щелкните ‎по ‎файлу‏ ‎правой‏ ‎кнопкой ‎мыши‏ ‎=> ‎свойства
  3. Ярлык,‏ ‎там ‎есть ‎«Сменить ‎значок…», ‎нажмите‏ ‎на‏ ‎него‏ ‎и ‎выберите‏ ‎соответствующий ‎файл‏ ‎значка, ‎который‏ ‎вы‏ ‎скачали


Изменяем ‎внешний‏ ‎вид ‎программы

  • Для ‎изменения ‎цветовой ‎темы‏ ‎программы ‎перейдите‏ ‎в‏ ‎настройки ‎программы: ‎«Settings»‏ ‎-> ‎«User‏ ‎interface» ‎-> ‎«Gradio ‎theme»‏ ‎->‏ ‎выберите ‎тему.
  • Сохраните‏ ‎настройки ‎и‏ ‎перезагрузите ‎программу: ‎Apply ‎settings» ‎->‏ ‎«Reload‏ ‎UI».
1


УСТРАНЕНИЕ ‎ОШИБОК‏ ‎И ‎ОПТИМИЗАЦИЯ‏ ‎ПРОГРАММЫ

❗ Если ‎ошибки ‎возникнут ‎в ‎дальнейшем‏ ‎использовании‏ ‎программы‏ ‎— ‎вернитесь‏ ‎к ‎этому‏ ‎сообщению.

Добавление ‎параметров‏ ‎поможет‏ ‎оптимизировать ‎программу:‏ ‎ускорить ‎генерации ‎или ‎избавиться ‎от‏ ‎ошибок. ‎Полный‏ ‎список‏ ‎параметров есть ‎на ‎официальной‏ ‎странице ‎проекта.‏ ‎Далее ‎я ‎приведу ‎список‏ ‎основных‏ ‎параметров.

Для ‎добавления‏ ‎параметров ‎откройте‏ ‎через ‎блокнот ‎файл ‎«webui-user.bat». ‎Параметры‏ ‎добавляются‏ ‎в ‎конце‏ ‎строки ‎«set‏ ‎COMMANDLINE_ARGS=». ‎Все ‎параметры ‎перечисляются ‎через‏ ‎пробел.‏ ‎Подробнее‏ ‎об ‎этом‏ ‎я ‎рассказывал‏ ‎в ‎видео‏ ‎об‏ ‎установке ‎программы.


➡️ Полезные‏ ‎параметры

--opt-sdp-attention

Уменьшает ‎потребление ‎памяти. ‎Уменьшает ‎время‏ ‎генерации ‎картинки‏ ‎на‏ ‎15-70%. ‎Работает ‎только‏ ‎на ‎видеокартах‏ ‎Nvidia.

--xformers

После ‎выхода ‎torch ‎2.0.0‏ ‎этот‏ ‎параметр ‎считается‏ ‎устаревшим ‎для‏ ‎современных. ‎Вместо ‎этого ‎используйте ‎параметр‏ ‎--opt-sdp-attention.

--autolaunch

Рекомендую‏ ‎использовать. ‎Автоматически‏ ‎открывает ‎веб-страницу‏ ‎в ‎браузере ‎после ‎завершения ‎загрузки‏ ‎программы.

--theme=dark

Включает‏ ‎тёмную‏ ‎тему ‎интерфейса‏ ‎программы.

--api

Не ‎включайте‏ ‎пока ‎в‏ ‎этом‏ ‎нет ‎необходимости.‏ ‎Требуется ‎для ‎некоторых ‎сторонних ‎расширений,‏ ‎которые ‎требуют‏ ‎доступ‏ ‎к ‎интернету.


➡️ Ускоряем ‎генерацию‏ ‎в ‎SDXL

  • Nvidia‏ ‎(12gb+) ‎--xformers
  • Nvidia ‎(8gb) ‎--medvram-sdxl‏ ‎--xformers
  • Nvidia‏ ‎(4gb) ‎--lowvram‏ ‎--xformers
  • AMD ‎(4gb)‏ ‎--lowvram ‎--opt-sub-quad-attention + TAESD ‎в ‎настройках

Читайте ‎так‏ ‎же:‏ ‎Оптимальное ‎использование‏ ‎SDXL ‎·‏ ‎AUTOMATIC1111/stable-diffusion-webui ‎Wiki ‎· ‎GitHub


➡️ Параметры ‎для‏ ‎устранения‏ ‎ошибок

--medvram

Для‏ ‎генераций ‎крупных‏ ‎картинок, ‎либо‏ ‎для ‎видеокарт‏ ‎с‏ ‎менее ‎чем‏ ‎6гб ‎видеопамяти. ‎Увеличивает ‎время ‎генерации!‏ ‎Используйте ‎параметр‏ ‎только‏ ‎при ‎острой ‎необходимости.

--lowvram

Работает‏ ‎как ‎предыдущая‏ ‎настройка, ‎но ‎еще ‎сильнее‏ ‎увеличивает‏ ‎время ‎генерации.‏ ‎Только ‎для‏ ‎самых ‎слабых ‎видеокарт ‎с ‎менее‏ ‎чем‏ ‎4гб ‎видеопамяти

--no-half-vae

Если‏ ‎генерируются ‎чёрные‏ ‎или ‎коричневые ‎квадраты. ‎Сильно ‎увеличивает‏ ‎использование‏ ‎памяти‏ ‎при ‎генерации.

--no-half

Требуется,‏ ‎если ‎у‏ ‎вас ‎проблемы‏ ‎с‏ ‎любой ‎генерацией,‏ ‎такое ‎бывает ‎на ‎16хх ‎серии‏ ‎видеокарт, ‎особенно‏ ‎с‏ ‎SD ‎2.x ‎моделями.


⁉️ Вопросы‏ ‎и ‎ответы

Что‏ ‎делать ‎обладателям ‎видеокарт ‎с‏ ‎низким‏ ‎VRAM? ‎(<=4‏ ‎ГБ)

  • Включите ‎оптимизации‏ ‎с ‎помощью ‎аргументов ‎командной ‎строки,‏ ‎но‏ ‎в ‎жертву‏ ‎придётся ‎принести‏ ‎скорость ‎генерации.
  • Если ‎у ‎вас ‎6‏ ‎ГБ‏ ‎видеопамяти‏ ‎и ‎вы‏ ‎хотите ‎создавать‏ ‎картинки ‎с‏ ‎разрешением‏ ‎512×512 ‎пикселей‏ ‎или ‎больше ‎— ‎используйте ‎параметр‏ ‎--medvram.
  • Если ‎добавление‏ ‎параметра‏ ‎--medvram ‎не ‎помогло,‏ ‎используйте ‎вместо‏ ‎него ‎--lowvram ‎--always-batch-cond-uncond.

Что ‎делать‏ ‎если‏ ‎генерируется ‎черный‏ ‎экран?

  • Причина ‎в‏ ‎том, ‎что ‎некоторые ‎видеокарты ‎не‏ ‎поддерживают‏ ‎«половинную ‎точность»:‏ ‎вместо ‎сгенерированных‏ ‎изображений ‎может ‎появиться ‎зеленый ‎или‏ ‎черный‏ ‎экран.‏ ‎Для ‎решения‏ ‎проблемы ‎используйте‏ ‎параметр ‎--upcast-sampling.
  • Если‏ ‎это‏ ‎не ‎помогло‏ ‎— ‎используйте ‎аргументы ‎--upcast-sampling ‎--precision‏ ‎full ‎--no-half.‏ ‎Эта‏ ‎настройка ‎увеличит ‎потребление‏ ‎VRAM. ‎Для‏ ‎компенсации ‎затраченной ‎VRAM, ‎потребуется‏ ‎включить‏ ‎--medvram.
  • В ‎некоторых‏ ‎случаях ‎ошибка‏ ‎может ‎быть ‎связана ‎с ‎VAE,‏ ‎тогда‏ ‎добавьте ‎параметр‏ ‎--no-half-vae.

Как ‎переустановить‏ ‎программу?

  • Удалите ‎папки ‎`venv` ‎и ‎`repositories`.‏ ‎Далее‏ ‎запустите‏ ‎программу ‎через‏ ‎`webui-user.bat`. ‎Необходимые‏ ‎модули ‎будут‏ ‎скачаны‏ ‎заново.

Часто ‎причиной‏ ‎ошибок ‎становятся ‎расширения ‎программы. ‎Расширения‏ ‎делают ‎члены‏ ‎сообщества‏ ‎любителей ‎Stable ‎Diffusion‏ ‎и ‎не‏ ‎всегда ‎это ‎опытные ‎программисты.‏ ‎Закройте‏ ‎программу, ‎переименуйте‏ ‎папку ‎с‏ ‎расширениями ‎`extensions` ‎— ‎так ‎SD‏ ‎потеряет‏ ‎их ‎и‏ ‎запустится ‎без‏ ‎расширений. ‎Если ‎ошибка ‎программы ‎не‏ ‎повторяется,‏ ‎то‏ ‎начинайте ‎поиск‏ ‎того ‎расширения,‏ ‎которое ‎сломало‏ ‎программу.



Следующая‏ ‎статья ‎№ 2.2 посвящена‏ ‎аренде ‎Stable ‎DIffusion ‎на ‎удаленных‏ ‎серверах. ‎Если‏ ‎вы‏ ‎уже ‎установили ‎программу‏ ‎— ‎переходите‏ ‎к ‎уроку ‎3.1 ‎Структура‏ ‎промпта.

Смотреть: 1+ мин
logo Technomagix

1.3 | На чьих картинках учился Stable Diffusion? | Курс по Stable Diffusion Automatic

Датасет ‎—‏ ‎это ‎набор ‎картинок, ‎на ‎которых‏ ‎обучается ‎нейросеть.‏ ‎В‏ ‎видео ‎я ‎покажу‏ ‎как ‎посмотреть‏ ‎на ‎эти ‎картинки ‎и‏ ‎как‏ ‎среди ‎них‏ ‎найти ‎свои‏ ‎фотографии ‎или ‎рисунки.

📃 Ссылки

Laion ‎5b ‎датасет

Тот‏ ‎самый‏ ‎пост с ‎челленджем‏ ‎на ‎генерацию‏ ‎Чебурашки.


Как ‎корпорации ‎и ‎государства ‎на‏ ‎нас‏ ‎наживаются

При‏ ‎обучении ‎Stable‏ ‎Diffusion ‎версии‏ ‎1.5 ‎использовался‏ ‎общедоступный‏ ‎датасет ‎изображений.‏ ‎Однако ‎большинство ‎компаний, ‎создающих ‎нейросети,‏ ‎например, ‎Midjourney,‏ ‎предпочитают‏ ‎не ‎раскрывать ‎источники‏ ‎данных, ‎использованных‏ ‎для ‎обучения ‎их ‎моделей.‏ ‎Государства‏ ‎тоже ‎не‏ ‎стесняются ‎использовать‏ ‎наши ‎персональные ‎данные ‎для ‎обучения‏ ‎надзирающего‏ ‎«Большого ‎брата»‏ ‎😈

Вы ‎вряд‏ ‎ли ‎сможете ‎с ‎уверенностью ‎сказать,‏ ‎были‏ ‎ли‏ ‎ваши ‎личные‏ ‎фотографии ‎задействованы‏ ‎при ‎обучении‏ ‎нейросети‏ ‎Midjourney. ‎Тем‏ ‎не ‎менее, ‎многие ‎социальные ‎сети‏ ‎и ‎интернет-платформы‏ ‎активно‏ ‎используют ‎пользовательский ‎контент,‏ ‎включая ‎тексты,‏ ‎видео ‎и ‎изображения, ‎для‏ ‎обучения‏ ‎своих ‎нейронных‏ ‎сетей ‎без‏ ‎ведома ‎и ‎согласия ‎авторов.

Происходит ‎ли‏ ‎это‏ ‎с ‎вашим‏ ‎контентом ‎в‏ ‎данный ‎момент? ‎Хотите ‎ли ‎вы,‏ ‎чтобы‏ ‎так‏ ‎было? ‎К‏ ‎сожалению, ‎пользователи‏ ‎зачастую ‎не‏ ‎имеют‏ ‎выбора ‎и‏ ‎возможности ‎проконтролировать ‎этот ‎процесс ‎🕵️

Хотя‏ ‎использование ‎персональных‏ ‎данных‏ ‎для ‎обучения ‎нейронок‏ ‎может ‎вызывать‏ ‎беспокойство ‎с ‎точки ‎зрения‏ ‎приватности,‏ ‎это ‎одновременно‏ ‎является ‎неотъемлемой‏ ‎частью ‎развития ‎технологий ‎искусственного ‎интеллекта.‏ ‎Нейросети‏ ‎обучаются ‎на‏ ‎больших ‎объемах‏ ‎разнообразных ‎данных, ‎и ‎пользовательский ‎контент‏ ‎является‏ ‎ценным‏ ‎источником ‎такой‏ ‎информации.

Компаниям ‎следует‏ ‎быть ‎более‏ ‎прозрачными‏ ‎в ‎отношении‏ ‎своих ‎практик ‎использования ‎данных ‎и‏ ‎предоставлять ‎пользователям‏ ‎возможность‏ ‎сделать ‎осознанный ‎выбор‏ ‎о ‎том,‏ ‎хотят ‎ли ‎они ‎делиться‏ ‎своим‏ ‎контентом ‎для‏ ‎этих ‎целей.


Нейросети‏ ‎— ‎наши ‎суперсилы

Я ‎обрисовал ‎общую‏ ‎информацию‏ ‎о ‎Stable‏ ‎Diffusion, ‎теперь‏ ‎давайте ‎взглянем ‎на ‎эту ‎технологию‏ ‎в‏ ‎более‏ ‎широком ‎контексте.

Согласно‏ ‎теории ‎диффузии‏ ‎инноваций, ‎процесс‏ ‎распространения‏ ‎новых ‎идей‏ ‎и ‎технологий ‎проходит ‎через ‎пять‏ ‎этапов. ‎Нейросети,‏ ‎несомненно,‏ ‎являются ‎важной ‎инновацией,‏ ‎которая ‎затронет‏ ‎все ‎сферы ‎нашей ‎жизни.‏ ‎В‏ ‎данный ‎момент‏ ‎мы ‎находимся‏ ‎на ‎границе ‎между ‎ранними ‎последователями‏ ‎и‏ ‎ранним ‎большинством‏ ‎пользователей ‎этой‏ ‎технологии.

Это ‎одновременно ‎наше ‎преимущество ‎и‏ ‎вызов.‏ ‎Чем‏ ‎раньше ‎мы‏ ‎освоим ‎нейросети,‏ ‎тем ‎больше‏ ‎выгод‏ ‎сможем ‎извлечь‏ ‎из ‎их ‎использования. ‎Однако ‎на‏ ‎ранних ‎этапах‏ ‎порог‏ ‎входа ‎выше, ‎индустрия‏ ‎только ‎формируется,‏ ‎а ‎набор ‎инструментов ‎стремительно‏ ‎меняется.‏ ‎Вот ‎в‏ ‎чем ‎заключается‏ ‎сложность ‎раннего ‎вхождения ‎в ‎новую‏ ‎область.

Сейчас‏ ‎идет ‎конкурентная‏ ‎борьба ‎между‏ ‎разработчиками ‎нейросетей, ‎и ‎мы, ‎как‏ ‎пользователи,‏ ‎получаем‏ ‎многообразие ‎продуктов.‏ ‎Пока ‎на‏ ‎рынке ‎не‏ ‎закрепились‏ ‎монополии, ‎каждый‏ ‎разработчик ‎стремится ‎удовлетворить ‎наши ‎потребности‏ ‎и ‎предоставить‏ ‎новые‏ ‎уникальные ‎возможности.

Тот ‎факт,‏ ‎что ‎вы‏ ‎смотрите ‎этот ‎курс, ‎говорит‏ ‎о‏ ‎том, ‎что‏ ‎вы ‎относитесь‏ ‎к ‎числу ‎тех, ‎кто ‎не‏ ‎хочет‏ ‎оставаться ‎на‏ ‎месте ‎и‏ ‎ищет ‎новые ‎горизонты. ‎Я ‎искренне‏ ‎рад,‏ ‎что‏ ‎вы ‎работаете‏ ‎над ‎собой‏ ‎и ‎обогащаетесь‏ ‎знаниями.

Освоение‏ ‎нейросетей ‎на‏ ‎этом ‎раннем ‎этапе ‎требует ‎усилий,‏ ‎но ‎это‏ ‎также‏ ‎открывает ‎перед ‎нами‏ ‎огромные ‎перспективы.‏ ‎Лет ‎20 ‎назад ‎в‏ ‎резюме‏ ‎было ‎принято‏ ‎писать ‎«Уверенный‏ ‎пользователь ‎ПК». ‎Сейчас ‎это ‎настолько‏ ‎базовая‏ ‎вещь ‎что‏ ‎упоминать ‎об‏ ‎этом ‎в ‎резюме ‎так ‎же‏ ‎нелепо‏ ‎как‏ ‎всерьез ‎заявлять:‏ ‎«Обучен ‎письму‏ ‎и ‎арифметике».

«Уверенный‏ ‎пользователь‏ ‎нейросетей» ‎—‏ ‎вот ‎новый ‎тренд ‎на ‎ближайшие‏ ‎годы! ‎Вместе‏ ‎мы‏ ‎сможем ‎стать ‎частью‏ ‎этой ‎революционной‏ ‎технологии ‎и ‎извлечь ‎максимальную‏ ‎пользу‏ ‎из ‎ее‏ ‎возможностей.


Далее: ‎2.1 Установка‏ ‎Stable ‎Diffusion ‎Automatic1111


Читать: 4+ мин
logo Technomagix

1.2 | Как создавался Stable Diffusion? | Курс по Stable Diffusion Automatic

Как ‎обучаются‏ ‎диффузионные ‎модели

В ‎основе ‎работы ‎Stable‏ ‎Diffusion ‎лежит‏ ‎диффузионная‏ ‎модель ‎машинного ‎обучения.‏ ‎Процесс ‎обучения‏ ‎этой ‎модели ‎начинается ‎с‏ ‎того,‏ ‎что ‎исследователи‏ ‎берут ‎реальные‏ ‎изображения ‎из ‎интернета ‎и ‎искусственно‏ ‎добавляют‏ ‎к ‎ним‏ ‎случайный ‎шум,‏ ‎похожий ‎на ‎помехи ‎на ‎старом‏ ‎телевизоре.‏ ‎Затем‏ ‎нейросеть ‎обучают‏ ‎убирать ‎этот‏ ‎шум ‎и‏ ‎восстанавливать‏ ‎исходное ‎изображение.

На‏ ‎ранних ‎этапах ‎обучения ‎шум ‎добавляется‏ ‎в ‎небольших‏ ‎количествах.‏ ‎Постепенно ‎его ‎уровень‏ ‎повышается, ‎пока‏ ‎в ‎конечном ‎итоге ‎изображение‏ ‎не‏ ‎будет ‎полностью‏ ‎замаскировано ‎случайными‏ ‎помехами. ‎Несмотря ‎на ‎это, ‎нейросеть‏ ‎учится‏ ‎находить ‎в‏ ‎этом ‎хаотичном‏ ‎шуме ‎визуальные ‎образы: ‎людей, ‎предметы,‏ ‎растения‏ ‎и‏ ‎другие ‎объекты.

Наступает‏ ‎момент, ‎когда‏ ‎нейросети ‎показывают‏ ‎картинку,‏ ‎состоящую ‎исключительно‏ ‎из ‎случайного ‎шума, ‎и ‎просят‏ ‎сгенерировать ‎изображение‏ ‎цветка,‏ ‎кота ‎или ‎шаурмы.‏ ‎И ‎удивительным‏ ‎образом ‎нейросеть ‎способна ‎увидеть‏ ‎в‏ ‎этом ‎беспорядочном‏ ‎наборе ‎пикселей‏ ‎искомые ‎объекты, ‎какими ‎бы ‎они‏ ‎ни‏ ‎были. ‎Этот‏ ‎процесс ‎и‏ ‎называется ‎«диффузионной ‎моделью» ‎машинного ‎обучения.

Но‏ ‎на‏ ‎этом‏ ‎возможности ‎нейросети‏ ‎не ‎заканчиваются.‏ ‎Она ‎не‏ ‎только‏ ‎находит ‎образы‏ ‎в ‎шуме, ‎но ‎и ‎постепенно‏ ‎добавляет ‎детали‏ ‎к‏ ‎изображению, ‎шаг ‎за‏ ‎шагом ‎преобразуя‏ ‎хаотичные ‎пиксели ‎в ‎привлекательную‏ ‎и‏ ‎реалистичную ‎картинку.

Чем‏ ‎больше ‎шагов‏ ‎удаления ‎шума ‎— ‎тем ‎лучше‏ ‎становится‏ ‎картинка, ‎но‏ ‎только ‎до‏ ‎некоторого ‎предела, ‎после ‎которого ‎картинка‏ ‎перестаёт‏ ‎улучшаться.‏ ‎Этот ‎процесс‏ ‎занимает ‎от‏ ‎1 ‎секунды‏ ‎до‏ ‎нескольких ‎минут‏ ‎в ‎зависимости ‎от ‎количества ‎шагов‏ ‎удаления ‎шума,‏ ‎размера‏ ‎картинки, ‎мощности ‎компьютера‏ ‎и ‎других‏ ‎параметров.

В ‎рамках ‎этого ‎курса‏ ‎мы‏ ‎сосредоточимся ‎на‏ ‎практическом ‎применении‏ ‎диффузионных ‎моделей, ‎таких ‎как ‎Stable‏ ‎Diffusion.‏ ‎Однако ‎для‏ ‎тех, ‎кто‏ ‎захочет ‎углубиться ‎в ‎технические ‎детали‏ ‎и‏ ‎узнать‏ ‎больше ‎о‏ ‎том, ‎как‏ ‎устроены ‎эти‏ ‎модели,‏ ‎я ‎предоставлю‏ ‎дополнительные ‎материалы ‎и ‎ресурсы.


Секрет ‎ёмкости‏ ‎нейросетей: ‎информация,‏ ‎а‏ ‎не ‎изображения

Задумывались ‎ли‏ ‎вы, ‎сколько‏ ‎изображений ‎может ‎храниться ‎в‏ ‎нейросети‏ ‎весом ‎всего‏ ‎4 ‎гигабайта?‏ ‎Для ‎сравнения, ‎обычный ‎DVD-диск ‎вмещает‏ ‎до‏ ‎4,7 ‎гигабайт‏ ‎данных. ‎Представьте,‏ ‎что ‎у ‎вас ‎на ‎компьютере‏ ‎есть‏ ‎папка‏ ‎с ‎фотографиями,‏ ‎занимающая ‎гигабайты‏ ‎или ‎даже‏ ‎десятки‏ ‎гигабайт. ‎Сколько‏ ‎же ‎реально ‎фотографий ‎может ‎содержаться‏ ‎в ‎такой‏ ‎папке?‏ ‎Тысячи ‎или ‎даже‏ ‎десятки ‎тысяч?

Теперь‏ ‎вопрос: ‎сколько ‎изображений, ‎по‏ ‎вашим‏ ‎предположениям, ‎может‏ ‎быть ‎«упаковано»‏ ‎в ‎нейросеть ‎объемом ‎4 ‎гигабайта?‏ ‎Попробуйте‏ ‎угадать ‎🤔

Правильный‏ ‎ответ ‎может‏ ‎вас ‎удивить: ‎5 ‎миллиардов ‎изображений‏ ‎упаковано‏ ‎в‏ ‎SD1.5! ‎🤯Однако‏ ‎стоит ‎уточнить,‏ ‎что ‎это‏ ‎не‏ ‎полноценные ‎изображения‏ ‎в ‎привычном ‎понимании, ‎а ‎скорее‏ ‎некая ‎информация,‏ ‎описывающая‏ ‎характерные ‎особенности ‎людей,‏ ‎животных, ‎предметов,‏ ‎стилей, ‎художественных ‎техник ‎и‏ ‎многого‏ ‎другого.

Нейросеть ‎не‏ ‎хранит ‎готовые‏ ‎изображения ‎как ‎таковые. ‎Вместо ‎этого‏ ‎она‏ ‎содержит ‎математические‏ ‎представления ‎визуальных‏ ‎концепций, ‎извлеченные ‎из ‎огромного ‎количества‏ ‎обучающих‏ ‎данных.‏ ‎Благодаря ‎этому‏ ‎нейросеть ‎способна‏ ‎генерировать ‎совершенно‏ ‎новые‏ ‎изображения, ‎комбинируя‏ ‎и ‎интерпретируя ‎усвоенные ‎закономерности ‎и‏ ‎паттерны.

Таким ‎образом,‏ ‎4‏ ‎гигабайта ‎данных ‎нейросети‏ ‎эквивалентны ‎информации,‏ ‎содержащейся ‎в ‎миллиардах ‎отдельных‏ ‎изображений,‏ ‎что ‎позволяет‏ ‎создавать ‎практически‏ ‎бесконечное ‎разнообразие ‎новых ‎визуальных ‎композиций.‏ ‎Именно‏ ‎эта ‎способность‏ ‎к ‎генерации‏ ‎уникального ‎контента ‎делает ‎нейросети, ‎такие‏ ‎как‏ ‎Stable‏ ‎Diffusion, ‎столь‏ ‎мощным ‎и‏ ‎революционным ‎инструментом.

1

🧠 Статьи‏ ‎для‏ ‎самых ‎любознательных‏ ‎с ‎углубленным ‎объяснением ‎того, ‎как‏ ‎устроен ‎SD:‏ ‎[рус.] [english‏ ‎1] [english ‎2]. Более ‎сложные‏ ‎технические ‎детали‏ ‎о ‎диффузионных ‎моделях: ‎[english].


Далее.‏ ‎1.3 На‏ ‎чьих ‎картинках‏ ‎учился ‎Stable‏ ‎Diffusion?

Читать: 6+ мин
logo Technomagix

1. 1 | Stable Diffusion: обзор технологии | Курс по Stable Diffusion Automatic

Stable ‎Diffusion‏ ‎был ‎выпущен ‎компанией ‎Stability ‎AI‏ ‎в ‎августе‏ ‎2022‏ ‎года ‎и ‎сразу‏ ‎же ‎приобрел‏ ‎популярность. ‎Для ‎него ‎создано‏ ‎множество‏ ‎плагинов, ‎оболочек,‏ ‎надстроек, ‎генераторов‏ ‎промптов ‎и ‎дополнительных ‎моделей. ‎Чёрт‏ ‎ногу‏ ‎сломит ‎во‏ ‎всём ‎этом‏ ‎многообразии ‎— ‎будем ‎идти ‎по‏ ‎прядку.‏ ‎Начнём‏ ‎с ‎железа.

Требования‏ ‎к ‎оборудованию

Stable‏ ‎Diffusion ‎может‏ ‎работать‏ ‎даже ‎на‏ ‎домашних ‎ПК, ‎оснащенных ‎видеокартой ‎с‏ ‎2 ‎ГБ‏ ‎видеопамяти.‏ ‎Генерация ‎на ‎таком‏ ‎компьютере ‎будет‏ ‎долгой, ‎лучше ‎вовсе ‎не‏ ‎использовать‏ ‎настолько ‎слабые‏ ‎видеокарты ‎и‏ ‎рассмотреть ‎аренду ‎онлайн ‎видеокарты, ‎к‏ ‎этому‏ ‎мы ‎ещё‏ ‎вернёмся ‎чуть‏ ‎позже. ‎6 ‎гигабайт ‎видеопамяти ‎уже‏ ‎приемлемо,‏ ‎но‏ ‎всё ‎ещё‏ ‎мало. ‎Для‏ ‎быстрой ‎и‏ ‎эффективной‏ ‎работы ‎рекомендуется‏ ‎видеокарта ‎с ‎16 ‎ГБ ‎памяти‏ ‎от ‎NVIDIA,‏ ‎это‏ ‎касается ‎не ‎только‏ ‎стейбла, ‎а‏ ‎вообще ‎любых ‎нейронок. ‎Хотите‏ ‎покупать‏ ‎новую ‎видеокарту‏ ‎— ‎берите‏ ‎Nvidia ‎— ‎не ‎ошибетесь. ‎Использование‏ ‎видеокарт‏ ‎других ‎производителей‏ ‎потребует ‎дополнительной‏ ‎настройки.

«У ‎меня ‎лапки, ‎я ‎просто‏ ‎хочу‏ ‎делать‏ ‎картинки ‎и‏ ‎ничего ‎не‏ ‎смыслю ‎в‏ ‎видеокартах».‏ ‎Окей, ‎вот‏ ‎простая ‎инструкция. ‎Просто ‎запустите ‎диспетчер‏ ‎задач ‎и‏ ‎откройте‏ ‎вкладку ‎«производительность».

Альтернативные ‎способы‏ ‎использования

Есть ‎упрощенные‏ ‎способы ‎использовать ‎SD ‎в‏ ‎виде‏ ‎ботов, ‎сайтов,‏ ‎и ‎приложений.‏ ‎Они ‎не ‎требуют ‎установки, ‎но‏ ‎и‏ ‎возможностей ‎там‏ ‎гораздо-гораздо ‎меньше.‏ ‎Например ‎https://www.mage.space/ или ‎https://playground.ai/

Принцип ‎работы

Чекпоинт ‎Stable‏ ‎Diffusion‏ ‎не‏ ‎содержит ‎картинок‏ ‎— ‎это‏ ‎не ‎библиотека‏ ‎и‏ ‎не ‎база‏ ‎знаний. ‎А ‎генерация ‎картинки ‎—‏ ‎не ‎тоже‏ ‎самое‏ ‎что ‎поиск ‎картинки‏ ‎в ‎гугл.‏ ‎Stable ‎Diffusion ‎не ‎создает‏ ‎коллажи‏ ‎из ‎фотографий.‏ ‎SD ‎скорее‏ ‎является ‎подобием ‎глины: ‎как ‎в‏ ‎куске‏ ‎глине ‎нет‏ ‎отдельных ‎рук,‏ ‎ног ‎и ‎голов, ‎так ‎и‏ ‎в‏ ‎Stable‏ ‎Diffusion ‎нет‏ ‎каких-то ‎конкретных‏ ‎частей, ‎но‏ ‎есть‏ ‎потенциальная ‎возможность‏ ‎обрести ‎форму. ‎Конечный ‎результат ‎зависит‏ ‎от ‎мастерства‏ ‎промпт-инженера.‏ ‎От ‎его ‎навыков‏ ‎написания ‎промпта.

Когда‏ ‎я ‎говорю ‎о ‎Stable‏ ‎Diffusion,‏ ‎то ‎имею‏ ‎ввиду ‎триединую‏ ‎систему, ‎состоящую ‎из: ‎языковой ‎модели,‏ ‎диффузионной‏ ‎модели ‎и‏ ‎декодера. ‎В‏ ‎простонародье ‎всё ‎это ‎зовется ‎просто‏ ‎чекпоинтом‏ ‎Stable‏ ‎Diffusion. ‎Да‏ ‎и ‎пофиг‏ ‎как ‎он‏ ‎там‏ ‎устроен, ‎мы‏ ‎рассматриваем ‎стейбл ‎как ‎пользователи ‎и‏ ‎не ‎будем‏ ‎слишком‏ ‎глубоко ‎погружаться ‎в‏ ‎тонкости, ‎но‏ ‎кое-что ‎на ‎курсе ‎я‏ ‎всё‏ ‎же ‎расскажу.‏ ‎Знание ‎базы‏ ‎сделает ‎нас ‎могущественными ‎промпт-шаманами!

Авторские ‎права

Вопрос‏ ‎авторских‏ ‎прав ‎на‏ ‎изображения, ‎сгенерированные‏ ‎с ‎помощью ‎нейронок, ‎остается ‎спорным.‏ ‎В‏ ‎некоторых‏ ‎случаях ‎создатели‏ ‎таких ‎работ‏ ‎могут ‎претендовать‏ ‎на‏ ‎авторские ‎права‏ ‎для ‎коммерческого ‎использования. ‎Однако ‎юридическая‏ ‎практика ‎в‏ ‎этой‏ ‎области ‎еще ‎не‏ ‎устоялась, ‎и‏ ‎иногда ‎суды ‎отказываются ‎признавать‏ ‎авторство‏ ‎за ‎создателями‏ ‎промптов ‎(промпт-инженерами).

Я‏ ‎провёл ‎опрос среди ‎подписчиков ‎своего ‎канала.‏ ‎61%‏ ‎людей ‎не‏ ‎поддержало ‎авторское‏ ‎право ‎на ‎промпт. ‎«За» ‎высказалось‏ ‎20%‏ ‎опрошенных‏ ‎респондентов.

Одна ‎из‏ ‎распространенных ‎точек‏ ‎зрения ‎заключается‏ ‎в‏ ‎том, ‎что‏ ‎Stable ‎Diffusion ‎— ‎это ‎всего‏ ‎лишь ‎инструмент,‏ ‎который‏ ‎выполняет ‎всю ‎работу‏ ‎по ‎генерации‏ ‎изображения, ‎а ‎вклад ‎человека‏ ‎незначителен.‏ ‎Однако ‎то‏ ‎же ‎самое‏ ‎можно ‎сказать ‎и ‎о ‎фотоаппарате.‏ ‎Фотограф‏ ‎нажимает ‎несколько‏ ‎кнопок, ‎а‏ ‎сложный ‎процесс ‎улавливания ‎и ‎преобразования‏ ‎фотонов‏ ‎в‏ ‎пиксели ‎происходит‏ ‎внутри ‎камеры.‏ ‎Фотограф ‎не‏ ‎создает‏ ‎композицию ‎из‏ ‎атомов, ‎а ‎фиксирует ‎существующую ‎реальность.‏ ‎Тем ‎не‏ ‎менее,‏ ‎мы ‎признаем ‎авторские‏ ‎права ‎фотографов‏ ‎на ‎их ‎работы.

Таким ‎образом,‏ ‎можно‏ ‎утверждать, ‎что‏ ‎создатель ‎промпта‏ ‎для ‎Stable ‎Diffusion ‎также ‎вносит‏ ‎творческий‏ ‎вклад, ‎подобно‏ ‎фотографу, ‎который‏ ‎выбирает ‎ракурс, ‎освещение ‎и ‎другие‏ ‎параметры‏ ‎съемки.‏ ‎Генерация ‎изображения‏ ‎с ‎помощью‏ ‎нейросети ‎—‏ ‎это‏ ‎своего ‎рода‏ ‎«фиксация» ‎виртуальной ‎реальности, ‎созданной ‎на‏ ‎основе ‎текстового‏ ‎описания.‏ ‎Следовательно, ‎авторство ‎создателя‏ ‎промпта ‎может‏ ‎быть ‎признано, ‎несмотря ‎на‏ ‎использование‏ ‎автоматизированного ‎инструмента.

Нужно‏ ‎учитывать, ‎что‏ ‎нейронка ‎училась ‎на ‎том, ‎что‏ ‎сделали‏ ‎люди, ‎миллиарды‏ ‎людей. ‎Многие‏ ‎из ‎нас ‎внесли ‎вклад ‎в‏ ‎обучение‏ ‎нейронки,‏ ‎но ‎могут‏ ‎даже ‎не‏ ‎знать ‎об‏ ‎этом.‏ ‎Все ‎мы‏ ‎авторы ‎и ‎учителя ‎для ‎нейронок.‏ ‎Получаем ‎ли‏ ‎мы‏ ‎от ‎этого ‎право‏ ‎на ‎результаты‏ ‎работы ‎нейронных ‎сетей? ‎Что‏ ‎вы‏ ‎думаете ‎об‏ ‎этом?

Особенности ‎генерации

Stable‏ ‎Diffusion ‎имеет ‎ограничения: ‎подвержен ‎социальным‏ ‎предубеждениям,‏ ‎плохо ‎умеет‏ ‎генерировать ‎разборчивый‏ ‎текст, ‎плохо ‎понимают ‎любые ‎языки‏ ‎кроме‏ ‎английского.

Изначально‏ ‎SD ‎был‏ ‎обучен ‎на‏ ‎квадратных ‎изображениях‏ ‎512×512‏ ‎пикселей. ‎Поэтому‏ ‎лучше ‎всего ‎он ‎генерирует ‎картинки‏ ‎с ‎равными‏ ‎пропорциями‏ ‎сторон. ‎При ‎попытке‏ ‎создать ‎прямоугольные‏ ‎изображения ‎с ‎людьми ‎высока‏ ‎вероятность‏ ‎получить ‎«мутантов».‏ ‎Позже ‎мы‏ ‎рассмотрим, ‎как ‎этого ‎избежать.


Читать ‎дальше:‏ ‎1.2 | Как‏ ‎создавался ‎Stable‏ ‎Diffusion?

Читать: 4+ мин
logo Technomagix

0.1 | Вступление | Курс по Stable Diffusion

Об ‎авторе‏ ‎курса

Привет, ‎друзья! ‎Меня ‎зовут ‎Никита, и‏ ‎я ‎с‏ ‎радостью‏ ‎приветствую ‎вас ‎на‏ ‎своем ‎курсе‏ ‎по ‎работе ‎с ‎технологией‏ ‎Stable‏ ‎Diffusion.

По ‎профессии‏ ‎я ‎инженер‏ ‎и ‎большую ‎часть ‎времени ‎занят‏ ‎разработкой‏ ‎станков ‎и‏ ‎различных ‎механизмов,‏ ‎но ‎в ‎душе ‎я ‎—‏ ‎художник.‏ ‎Stable‏ ‎Diffusion ‎я‏ ‎использую ‎с‏ ‎первого ‎дня‏ ‎его‏ ‎выпуска. ‎До‏ ‎выхода ‎SD ‎я ‎был ‎тестировщиком‏ ‎закрытой ‎версии‏ ‎нейросети‏ ‎Midjourney, ‎до ‎появления‏ ‎Midjourney ‎генерировал‏ ‎изображения ‎в ‎Disco ‎Diffusion‏ ‎и‏ ‎других ‎нейросетях,‏ ‎поэтому ‎к‏ ‎моменту ‎появления ‎SD ‎я ‎уже‏ ‎хорошо‏ ‎разбирался ‎в‏ ‎генерации ‎изображений‏ ‎нейронными ‎сетями.

Когда ‎Стэйбл ‎Дифьюжн ‎только‏ ‎появился,‏ ‎разработчики‏ ‎не ‎предоставили‏ ‎никаких ‎курсов‏ ‎или ‎инструкций.‏ ‎Мне‏ ‎пришлось ‎изучать‏ ‎все ‎самостоятельно, ‎путем ‎долгих ‎экспериментов‏ ‎и ‎сбора‏ ‎информации‏ ‎по ‎крупицам. ‎Это‏ ‎подтолкнуло ‎меня‏ ‎записать ‎несколько ‎обучающих ‎видео‏ ‎для‏ ‎ютюба, ‎и‏ ‎я ‎стал‏ ‎одним ‎из ‎первых ‎проводников ‎в‏ ‎мир‏ ‎Stable ‎Diffusion‏ ‎для ‎сотен‏ ‎тысяч ‎русскоязычных ‎пользователей. ‎Если ‎вы‏ ‎когда-нибудь‏ ‎пытались‏ ‎дообучать ‎Стейбл‏ ‎на ‎своих‏ ‎фотографиях, ‎то‏ ‎скорее‏ ‎всего ‎знакомы‏ ‎с ‎моими ‎видеоуроками.

Чтобы ‎объединить ‎единомышленников,‏ ‎я ‎создал‏ ‎сообщество‏ ‎Technomagix, через ‎которое ‎прошли‏ ‎тысячи ‎людей,‏ ‎интересующихся ‎нейронками ‎для ‎создания‏ ‎изображений.‏ ‎Многие ‎писали‏ ‎мне ‎в‏ ‎личку ‎с ‎просьбами ‎о ‎помощи,‏ ‎отсюда‏ ‎возникла ‎идея‏ ‎записать ‎курс.‏ ‎В ‎этом ‎курсе ‎я ‎аккумулировал‏ ‎свой‏ ‎собственный‏ ‎опыт ‎и‏ ‎опыт ‎многих‏ ‎других ‎пользователей,‏ ‎чтобы‏ ‎помочь ‎вам‏ ‎освоить ‎эту ‎мощную ‎технологию.

1

Структура ‎курса

➡️ Изучайте‏ ‎темы ‎последовательно,‏ ‎начиная‏ ‎с ‎первой. ‎Вы‏ ‎можете ‎пропустить‏ ‎некоторые ‎темы, ‎но ‎не‏ ‎забудьте‏ ‎вернуться ‎к‏ ‎ним ‎позже.

➡️ После‏ ‎каждой ‎темы ‎предусмотрены ‎практические ‎задания‏ ‎для‏ ‎закрепления ‎пройденного‏ ‎материала. ‎Обязательно‏ ‎выполняйте ‎их ‎для ‎закрепления ‎навыков.

➡️ Новые‏ ‎уроки‏ ‎будут‏ ‎выходить ‎примерно‏ ‎раз ‎в‏ ‎неделю.

➡️ Приветствую ‎ваше‏ ‎активное‏ ‎участие ‎в‏ ‎дополнении ‎информации ‎к ‎курсу. ‎Наиболее‏ ‎полезные ‎материалы‏ ‎и‏ ‎ссылки, ‎присланные ‎вами,‏ ‎будут ‎добавлены‏ ‎в ‎курс.

Что ‎будем ‎изучать?

Курс‏ ‎посвящен‏ ‎не ‎только‏ ‎самой ‎нейросети‏ ‎Stable ‎Diffusion, ‎но ‎и ‎программе‏ ‎Automatic1111‏ ‎— ‎удобному‏ ‎веб-интерфейсу ‎для‏ ‎работы ‎с ‎ней. ‎В ‎Automatic1111‏ ‎вы‏ ‎сможете‏ ‎обучать ‎собственные‏ ‎модели ‎нейросети,‏ ‎реставрировать ‎и‏ ‎стилизовать‏ ‎фотографии, ‎создавать‏ ‎анимации, ‎выводить ‎матрицы ‎изображений ‎для‏ ‎поиска ‎нужных‏ ‎параметров‏ ‎и ‎многое ‎другое.‏ ‎Возможностей ‎у‏ ‎этой ‎программы ‎очень ‎много,‏ ‎и‏ ‎новые ‎функции‏ ‎появляются ‎регулярно.

При‏ ‎прохождении ‎этого ‎курса ‎вы ‎освоите‏ ‎фундаментальные‏ ‎принципы ‎работы‏ ‎с ‎Automatic1111‏ ‎и ‎понимая ‎базовые ‎вещи ‎сможете‏ ‎легко‏ ‎переключитесь‏ ‎на ‎другие‏ ‎программы ‎для‏ ‎работы ‎с‏ ‎Stable‏ ‎Diffusion. ‎Ознакомившись‏ ‎с ‎основными ‎фишками, ‎вы ‎будете‏ ‎готовы ‎к‏ ‎свободному‏ ‎путешествию ‎и ‎изучению‏ ‎десятков ‎дополнительных‏ ‎плагинов, ‎написанных ‎талантливыми ‎программисты‏ ‎по‏ ‎всему ‎миру.

*Забавный‏ ‎факт: ‎на‏ ‎самом ‎деле ‎программа ‎не ‎имеет‏ ‎никакого‏ ‎названия. ‎Словом‏ ‎Automatic1111 ‎называется‏ ‎аккаунт ‎разработчика, ‎который ‎делает ‎вэб-интерфейс‏ ‎для‏ ‎Стейбла,‏ ‎но ‎все‏ ‎привыкли ‎называть‏ ‎программу ‎словом‏ ‎«Автоматик».

Благодаря‏ ‎развитому ‎и‏ ‎дружелюбному ‎сообществу ‎разработчиков, ‎Stable ‎Diffusion‏ ‎обладает ‎рядом‏ ‎преимуществ‏ ‎перед ‎аналогами. ‎Если‏ ‎у ‎вас‏ ‎возникнут ‎проблемы ‎или ‎вопросы,‏ ‎вы‏ ‎всегда ‎можете‏ ‎обратиться ‎в‏ ‎мое ‎сообщество ‎Technomagix ‎в ‎Телеграме.‏ ‎Там‏ ‎же ‎вы‏ ‎сможете ‎поделиться‏ ‎своими ‎работами, ‎созданными ‎с ‎помощью‏ ‎искусственного‏ ‎интеллекта.

В‏ ‎ходе ‎курса‏ ‎вас ‎ждут‏ ‎практические ‎задания‏ ‎для‏ ‎закрепления ‎полученных‏ ‎знаний. ‎Эти ‎задания ‎не ‎будут‏ ‎проверяться, ‎но‏ ‎они‏ ‎крайне ‎важны ‎для‏ ‎приобретения ‎собственного‏ ‎опыта ‎работы ‎с ‎нейросетью.‏ ‎Практические‏ ‎задания ‎будут‏ ‎публиковаться ‎в‏ ‎отдельных ‎постах, ‎доступных ‎подписчикам ‎курса.

Я‏ ‎буду‏ ‎рад, ‎если‏ ‎вы ‎поддержите‏ ‎меня ‎лайками ‎и ‎репостами. ‎И‏ ‎вознаградите‏ ‎мой‏ ‎труд ‎донатами‏ ‎или ‎криптой.‏ ‎Ваша ‎поддержка‏ ‎очень‏ ‎важна ‎для‏ ‎дальнейшего ‎развития ‎курса ‎и ‎сообщества!

Давайте‏ ‎вместе ‎отправимся‏ ‎в‏ ‎увлекательное ‎путешествие ‎по‏ ‎миру ‎искусственного‏ ‎интеллекта ‎и ‎генеративного ‎искусства‏ ‎с‏ ‎помощью ‎Stable‏ ‎Diffusion! ‎Присоединяйтесь,‏ ‎будет ‎интересно!

В ‎телеграм-канале ‎Дневник ‎Алхимика пишу‏ ‎о‏ ‎разных ‎нейронках.‏ ‎Подписывайтесь)


Следующая ‎тема:‏ ‎1.1 | Stable ‎Diffusion: ‎обзор ‎технологии

Подарить подписку

Будет создан код, который позволит адресату получить бесплатный для него доступ на определённый уровень подписки.

Оплата за этого пользователя будет списываться с вашей карты вплоть до отмены подписки. Код может быть показан на экране или отправлен по почте вместе с инструкцией.

Будет создан код, который позволит адресату получить сумму на баланс.

Разово будет списана указанная сумма и зачислена на баланс пользователя, воспользовавшегося данным промокодом.

Добавить карту
0/2048