83 года назад предсказание одного писателя-фантаста о грядущем контент-кризисе сегодня устрашающе резонирует

83 года назад предсказание одного писателя-фантаста о грядущем контент-кризисе сегодня устрашающе резонирует

Как опытный геймер, побывавший в бесчисленных виртуальных мирах и цифровых ландшафтах, я своими глазами стал свидетелем эволюции технологий. Потенциальное будущее Интернета, описанное в этой статье Нилом Стивенсоном и Хорхе Луисом Борхесом, не только увлекательно, но и пугающе правдоподобно.


Как будет развиваться Интернет в ближайшие десятилетия?

Писатели-фантасты исследовали некоторые возможности.

В своей книге «Падение» 2019 года известный писатель-фантаст Нил Стивенсон нарисовал видение не столь отдаленного будущего, в котором Интернет сохранится, но из-за переизбытка ложной информации, обмана и рекламы он в значительной степени стал неработоспособным.

Персонажи романа Стивенсона находят решение этой проблемы, выбирая «доверенные новостные ленты» — тщательно выбранные источники новостей и информации, которые считаются надежными.

Истина где-то рядом, как и любая мыслимая ложь.

Как геймер, я часто тоскую по высококачественным, адаптированным игровым процессам, но кажется, что только те, у кого глубокие карманы, могут получить доступ к этим индивидуальным услугам. Большинству из нас приходится просматривать общий, нефильтрованный контент в Интернете, что не всегда является лучшим.

В определенной степени это развитие уже происходит: многочисленные новостные агентства, в том числе The New York Times и The Wall Street Journal, начали взимать плату за доступ к своим избранным статьям (часто это называется платным доступом к ним). В то же время ложная информация продолжает беспрепятственно распространяться в социальных сетях, таких как X и TikTok.

Способность Стивенсона предсказывать технологические достижения была поразительна. Например, в своем романе 1992 года «Снежный крах» он предвидел концепцию метавселенной. Более того, одним из важных аспектов его книги 1995 года «Бриллиантовый век» является персонаж, называемый интерактивным букварем, который действует аналогично современному чат-боту.

На первый взгляд чат-боты кажутся потенциальным средством от распространения ложной информации. Они могут предоставлять точные данные, предоставляя дополнительные надежные источники информации без ограничений, налагаемых платным доступом.

83 года назад предсказание одного писателя-фантаста о грядущем контент-кризисе сегодня устрашающе резонирует

Интересно и тревожно то, что продукты, создаваемые этими чат-ботами, могут представлять значительную угрозу будущему Интернета – риск, на который много лет назад намекал аргентинский писатель Хорхе Луис Борхес.

Расцвет чат-бота с искусственным интеллектом

Значительная часть того, что мы сегодня находим в Интернете, — это информация, которая выглядит фактической и заслуживающей доверия, например, статьи, книги или другой контент, прошедший проверку коллегами, проверку или оценку.

Создатели обширных систем языковых моделей (LLM), которые служат основой для чат-ботов, таких как ChatGPT, Copilot и Gemini, эффективно использовали этот ценный ресурс.

Проблема в том, что Интернет, каким бы огромным он ни был, является ограниченным ресурсом.

Чтобы эффективно произносить заклинания, этим моделям требуется большой объем первоклассного текста для обучения. Уже сейчас значительный объем текста, полученного из различных онлайн-ресурсов, передается в растущее число моделей изучения языка (LLM).

Проблема в том, что Интернет, каким бы огромным он ни был, является ограниченным ресурсом. Высококачественный текст, который еще не был очищен, становится дефицитным, что приводит к тому, что The New York Times назвала «возникающим кризисом контента».

Как преданный энтузиаст, я заметил, что такие компании, как OpenAI, были вынуждены сотрудничать с издателями, обеспечивая больше ресурсов для своих ненасытных ИИ-ботов. Интересно, что некоторые эксперты прогнозируют потенциальную нехватку данных по обучению высшего уровня уже в 2026 году, что может создать проблемы в ближайшем будущем.

Привет, товарищ геймер! Вы знаете, как иногда в Интернете натыкаешься на какую-то странную и дурацкую информацию? Что ж, похоже, что некоторые из этих чат-ботов штампуют текст второго поколения, наполненный вымышленными вещами (назовем это «галлюцинациями») и прямыми ошибками. Например, вы можете найти предложения полить пиццу клеем вместо томатного соуса! Так что да, они усугубляют цифровой хаос.

Если чат-бот взаимодействует в Интернете с вредными или оскорбительными людьми, он может непреднамеренно узнать и распространить их неприятные мнения. К сожалению, Microsoft столкнулась с этим в 2016 году, когда им пришлось прекратить работу Tay, бота, который начал распространять расистский и сексистский контент.

Со временем эти опасения могут привести к тому, что онлайн-контент станет менее надежным и полезным по сравнению с тем, что мы имеем сейчас. Более того, модели изучения языка (LLM), обученные на низкокачественном контенте, потенциально могут генерировать еще более сомнительные результаты, которые впоследствии могут заполнить Интернет.

Бесполезная библиотека

Нетрудно представить петлю обратной связи, которая приводит к непрерывному процессу деградации, поскольку боты питаются собственными несовершенными результатами.

В исследовании, опубликованном в журнале Nature в июле 2024 года, изучалось влияние обучения моделей ИИ с использованием данных, сгенерированных рекурсивно. Исследование показало, что дефекты или «необратимые дефекты» могут вызвать состояние, известное как «коллапс модели», которое похоже на то, как исходное изображение и последующие копии со временем теряют свое исходное качество, при этом каждая копия все больше искажается по сравнению с оригиналом.

Насколько это может быть плохо?

Вдумайтесь в рассказ Борхеса 1941 года под названием «Вавилонская библиотека». За полвека до того, как ученый-компьютерщик Тим Бернерс-Ли разработал структуру Интернета, Борхес придумал нечто поразительно похожее по концепции.

В длинном повествовании автора он представляет себе обширное или, возможно, бесконечное царство, состоящее из бесчисленных шестиугольных комнат. Каждая комната украшена книжными полками, заполненными одинаковыми фолиантами, которые, кажется, инстинктивно понимают их обитатели, содержат все мыслимые комбинации букв их алфавита.

На первый взгляд, доставляет огромное удовольствие осознание того, что могут существовать книги, исследующие судьбу человечества и суть цели жизни.

Люди продолжают искать эти книги, но обнаруживают, что большинство из них заполнены бессмысленными сочетаниями букв. Да, правда существует, но существует и любой возможный обман. Оно скрыто в невообразимом объеме чепухи.

После многих столетий поисков было обнаружено лишь несколько важных экспонатов. Однако остается неясным, являются ли эти последовательные фрагменты фактами или ложью. Надежда постепенно сменяется разочарованием.

Возможно ли, что Интернет настолько захламится дезинформацией, предвзятым контентом и платной рекламой, что только те, кто может себе это позволить, будут иметь доступ к достоверным и правдивым данным? С другой стороны, можем ли мы достичь точки, когда будет распространяться огромное количество информации, генерируемой ботами, из-за чего пользователям будет все труднее находить точную и надежную информацию в Интернете, подобно проблеме поиска иголки в огромном стоге сена?

Размышляя о значении Интернета в истории человечества, крайне важно не упускать из виду его обслуживание и управление. Небрежность может привести нас в мрачное будущее, предсказанное Борхесом.

Смотрите также

2024-11-23 17:28