Низкофоновый контент через год будет дороже антиквариата. Дегенеративное заражение ноофосферы идет быстрее закона Мура.
Низкофоновая сталь (довоенная или доатомная сталь) — это любая сталь, произведенная до взрыва первых ядерных бомб в 1940 — 50-х годах.
До первых ядерных испытаний никто и не предполагал, что в результате порождаемого ими относительно невысокого радиоактивного заражения, на Земле возникнет дефицит низкофоновой стали, нужной для изготовления детекторов ионизирующих частиц — счётчик Гейгера, приборы для космоса и так далее.
Но оказалось, что уже после первых ядерных взрывов, чуть ли не единственным источником низкофоновой стали оказался подъем затонувших за последние полвека кораблей. И ничего не оставалось, как начать подъем с морского дна одиночных кораблей и целых эскадр по типу Имперского флота Германии, затопленные в Скапа-Флоу в 1919.
Но и этого способа добычи низкофоновой стали особенно на долго не хватило бы. И ситуацию спасло лишь запрещение атмосферных ядерных испытаний, после чего радиационный фон со временем снизился до уровня, близкого к естественному.
С началом испытаний генеративного ИИ в 2022 г также никто не заморачивался в плане рисков «дегенеративного заражения» продуктами этих испытаний.
· Речь здесь идет о заражении не атмосферы, а ноосферы, что не легче.
· Перспектива загрязнения последней продуктами творчества генеративного ИИ может иметь весьма пагубные и далеко идущие последствия.
Первые результаты заражения спустя 1.5 года после начала испытаний генеративного ИИ поражают свои масштабом. Похоже, что заражено уже все. И никто не предполагал столь высокой степени заражения.
Ибо не принималось в расчет наличие мультипликатора — заражения от уже зараженного контента, о чем вчера поведал миру Ник Сен-Пьер — креативный директор и неофициальный представитель Midjourney.
Данные, опубликованные Ник Сен-Пьером впечатляют:
• Более 13% всех изображений в Adobe Stock созданы с помощью генеративного ИИ.
• Большая часть сгенерированного контента поступает от Dalle и Midjourney.
• Медиа с тегом «фэнтези» на 43% создано ИИ. Другие теги еще выше.
• Это большая часть обучающих данных, которые питают генеративный ИИ Adobe Firefly-генератор изображений на базе ИИ от Adobe.
Скорость затопления инфосети контентом, «зараженным ИИ»-контент произведенный с помощью генеративного ИИ, обученного на контенте, произведенном генеративным ИИ, просто колоссальна.
Получается, что любой контент, произведенный после 2022, включая все интернет-архивы, почти наверняка «заражен» генеративным ИИ, и уровень этого заражения совсем немал. Что и превращает такой генеративный контент, извините за каламбур, в дегенеративный.
Комментируя это, Итан Молик-профессор Уортона, изучающий ИИ, придумал использованную мною выше метафору — низкофоновая сталь.
Продолжая эту метафору, легко представить, что всего через несколько лет «низкофоновый» (догенеративный) контент станет в ноосфере столь же редким и дорогим, как самый изысканный и старинный антиквариат.
Но это еще не все.
В результате роста в обучающих наборах новых моделей генеративного ИИ доли контента, порожденного с помощью предыдущих версий моделей, начнется процесс, названный Россом Андерсоном коллапсом больших языковых моделей (LLM).
Ситуация будет напоминать комедию «Множественность» с Майклом Китоном в главной роли, в которой скромный человек клонирует себя, а затем клонирует клонов, каждое поколение которых ведет к экспоненциальному снижению уровня интеллекта и увеличению глупости клона.
С LLM будет происходить то же самое. Использование для обучения модели контента, сгенерированного моделью, вызывает необратимые дефекты. Хвосты исходного распределения контента исчезают. В течение нескольких поколений текст становится мусором, поскольку распределения Гаусса сходятся и могут даже стать дельта-функциями. Более поздние поколения начнут производить образцы, которые никогда не были бы произведены оригинальной моделью, то есть они будут неправильно воспринимать реальность, основываясь на ошибках, внесенных их предками.
И речь не только про тексты, но и про изображения, видео, музыку. Если вы обучаете музыкальную модель Моцарту, вы можете ожидать, что результат будет немного похож на Моцарта, но без блеска — назовем его «Сальери». И если потом Сальери обучит следующее поколение и так далее, то как будет звучать пятое или шестое поколение?
Вот это и называется «коллапсом модели», в результате которого:
-Интернет все более будет забиваться чушью;
-Люди, которые, наряду с LLM, будут этой чушью информационно напитываться, будут неумолимо глупеть.
Но и это еще не все.
Потом коллапс моделей приведет к тому, что цунами инфомусора окончательно накроет науку.
Разруха, начавшаяся с дегенеративного заражения Интернета, потом имеет все шансы переходить в новые поколения LLM, а потом и в головы новых поколений людей.
И наконец, в добавок ко всему названному, будет нарастать число мутаций языка и подмена когнитивных микроэлементов на помои снов ИИ.
Перспектива вымывания «когнитивных микроэлементов», на смену которым придет синтетический мусор, светит не только разговорным и письменным языкам человечества. Но и языкам наук и изобразительным языкам.
Можно ли все это остановить?
Возможно, да. Если остановить дегенеративное заражение ноофосферы.
Радиоактивное заражение атмосферы человечество смогло остановить, отказавшись от атмосферных испытаний ядерного оружия.
Отказа от генеративного ИИ уже не будет. Этот джин, к счастью или на беду человечества, уже выпущен из бутылки. И слишком заманчивые перспективы для той же науки и здоровья людей этот джин сулит.
Так значит, нужно срочно искать методы обеззараживания ноосферы от дегенеративного заражения, которое уже началось и вовсю идет.