Стопка дисков от Земли до Луны

Объем хранимой информации на планете Земля за двадцать лет увеличился примерно в сто раз, и, согласно подсчетам ученых, в 2007 году он составлял 295 эксабайт (295 миллиардов гигабайт).

Журнал Science опубликовал результаты исследования Мартина Гилберта (Университет Южной Калифорнии) и Присциллы Лопес (Открытый университет Каталонии), подсчитавших информационную емкость человеческой цивилизации. Целью работы было определить совокупный объем информации, доступной для искусственного хранения, передачи и обработки, то есть подсчитывались все, по возможности, учтенные и находящиеся в обороте данные, представленные в машиночитаемом виде. Заметим, что это очень важное ограничение, выводящее за скобки большой объем «немашинной» информации, представленной в виде прямых вербальных коммуникаций, а также мыслительной деятельности и биологической активности, совершаемых нами без участия искусственно созданных устройств и технологий.

С созданием искусственного интеллекта и техник, свободно манипулирующих геномом, это ограничение будет, возможно, снято.

Анализу подверглись 21 аналоговая и 39 цифровых технологий за период с 1986 по 2007 год. Эта выборка существенно превышает предыдущие (в частности, выборку компании EDC, сделавшей сходное исследование три года назад), и на данный момент ее можно считать самой полной. Для корректного подсчета совокупный объем информации был поделен на три группы: хранимая информация (учитывается емкость всех известных устройств хранения), передаваемая (емкость всех типов одно- и двунаправленных трансляций) и трансформируемая (емкость вычислительных процессов). Границы между технологиями иногда размыты, и такие тонкости тоже принимались в расчет. Простой пример – оперативная память RAM. Устройство запоминающее, но на самом деле оно является частью вычислительного процесса, поэтому отнесено к третьей группе.

Более сложный случай – технология печатных СМИ (газеты и журналы), которые участвуют как в передаче информации на значительные расстояния, так и в ее хранении на бумажных носителях. Вклад «газетных» мегабайт учитывался в обеих группах.

Широту охвата технологий и устройств можно оценить в специальном приложении к статье, где перечислены данные по информационному вкладу даже таких карликов, как калькуляторы, или более экзотичных случаев, например – рентгенографии. Под учет попали и игровые консоли, и виниловые пластинки, и цифро-аналоговые преобразователи, и промышленные микроконтроллеры, не говоря уже о книгах, аналоговом радио и даже традиционной почте.

Для корректного суммирования разнородной информации, например – в газете с информацией на кассете VHS или микрочипе, используется методика унификации данных. Емкость всех информационных носителей конвертирована в байты и нормирована через коэффициенты сжатия, при этом каждой разновидности данных назначен свой коэффициент. Все это необходимо для построения финальной унифицированной шкалы. Понятно, что 1Мb несжатого видео в 1987 году содержал меньше информации, чем такой же мегабайт, сжатый MPEG-4 в 2007-м, и сопоставлять их некорректно. После оптимизации (взяв за точку отсчета современные алгоритмы компрессии) видеомегабайт 87-го года окажется равен оптимизированному 0,017 Мb, мегабайт 93-го (кодек Cinepack) – 0,33 Mb , 2000-го (MPEG-1) – 0,45 Мb. Такие же коэффициенты есть для текстовых и графических данных. Все подсчеты даются именно в оптимизированных байтах.

Неучтенной, пожалуй, оказалась лишь система дорожных знаков, пиктографическая информация в общественных местах, тексты Брайля, деревянные счеты, маркировки на устройствах машинно-человеческого интерфейса или устройства, основанные на троичной логике, но в такие дебри авторы решили не углубляться, да и надежной статистики по ним нет.

Согласно авторам публикации в Science, объем хранимой информации за двадцать лет увеличился на планете Земля примерно в сто раз – с 2,6 эксабайт (эксабайт – миллиард гигабайт) в 1986 году до 295 эксабайт в 2007-м.

Если посчитать этот объем информации в компакт-дисках, то в 1986 году понадобилось меньше чем одна болванка на человека, в 1993 – четыре CD на одного человека, 12 – в 2002-м, и, наконец, целый 61 диск пришелся бы на жителя Земли в 2007-м.

Стопка таких болванок покроет расстояние, на четверть большее, чем от Земли до Луны, а чтобы скопировать ее, потребовалось бы примерно 295 миллионов терабайтных винчестеров, или 295 миллиардов гигабайтных флешек.

При этом доля цифровых способов хранения (25%) еще уступала аналоговым в 2000 году, а резкий перелом произошел лишь в 2002-м, что можно считать официальной точкой отсчета цифровой революции. Так, через пять лет на долю цифры приходилось уже 94% хранимой информации. На долю бумажных носителей в 2007-м осталось 0,007% (0,33% в 1986-м, когда большая часть байт тоже пожиралась мультимедиа – кассетами VHS, виниловыми пластинками и аудиокассетами), хотя в общей сложности объем бумажной памяти увеличился в два раза с 8,7 до 19,4 петабайт (то есть вся бумажная информация уложилась бы в 2007 году на 20 тысячах терабайтных дисках).

В 2007 году совокупный объем переданной информации равнялся 2 зеттабайтам (два миллиарда терабайтных винчестеров). Подавляющая ее часть (1,9 Зб) приходится на технологии однонаправленного вещания, то есть все разновидности ТВ, телетекст, а также газеты, журналы и GPS. При этом только четверть такого вещания была цифровой. А вот на двунаправленные коммуникации в 2007-м пришлось несравнимо меньше – 65 эксабайт. Иначе говоря, в 2007-м на одного человека в день приходилось 784 Мб вещательных и только 27 Мб телекоммуникационных данных (в 1986-м – 241 и 0,16), и это с поправками на эффективное, то есть спорадическое использование этих каналов. Но даже с такими поправками одно вещательное устройство в среднем транслировало в 2007-м в 27 раз больше информации в день, чем один коммуникатор (компьютер, мобильный телефон, смартфон и пр.).

Грубо говоря, через телевизор три года назад изливалось в три раза больше информации, чем через интернет и связь – холодный душ на головы апологетов интернет-революции!

Впрочем, «зомбоящик» пока что побеждает, но быть ему лидером осталось недолго: за 20 лет темпы ежегодного прироста телекоммуникационных байтов опережали прирост вещательных в среднем в пять раз (6% в год – у вещателей, 28% – у телекоммуникаций). Также следует учитывать, что по вещательным каналам передаются большей частью «тяжелые» звук и видео, интернет же насыщен текстовыми и графическими данными, использующими меньше байт.

Если бы, к примеру, в 2007-м в космос к инопланетянам отправились бы все граждане Китая, то для того, чтобы взять с собой всю информацию за год – как искусственно записанную человечеством, так и переданную по всем каналам связи, – каждому китайцу нужно было бы выдать всего лишь два терабайтных винчестера.

Сложнее представить наглядно совокупную вычислительную емкость цифровых устройств (аналоговые – механические арифмометры, счеты, логарифмические линейки и пр. – используются уже ничтожно мало). Производимый на протяжении 2007 года всеми компьютерами 6,4 10¹² миллион операций в секунду (МОПС) мало что дадут нашему воображению. А вот сравнительная динамика более интересна: в течение двадцати лет темпы роста именно вычислительных технологий (83% в год) значительно превышали темпы роста технологий хранения информации (23% в год) и ее передачи на расстояние (30% в год).

При этом львиная доля этих 83% приходится не на компьютеры общего назначения (серверы, суперкомпьютеры, мэйнфреймы, настольные и мобильные устройства с человеческим интерфейсом), а на прикладные компьютеры (цифро-аналоговые преобразователи, микроконтроллеры, графические процессоры).

97% МОПС, проведенные прикладными компьютерами в 2007 году, производили устройства для обработки графики. Разбитым, таким образом, оказался еще один миф: локомотивом цифровой революции являются не рост коммуникаций и не рост объема хранимой информации, а технологии по изменению информации и созданию виртуальной реальности в широком диапазоне от моделирования и построения прогностических моделей (в случае с суперкомпьютерами и сетевыми вычислениями) до игр (25% МОПС пришлось в 2007-м на видеоприставки).

Статистика статистикой, но пока не конвертирована в оптимизированные байты оставшаяся за кадром информация, играющая в нашей жизни ключевую роль (начать хотя бы с процесса воспитания детей, передачи культурных навыков, обмена эмоциями и опытом, личных знакомств и прочих оффлайновых и, скорей всего, алгоритмически невычислимых практик), подсчитанная информационная емкость человеческой цивилизации останется вавилонским столпотворением впечатляющих, но бессмысленных цифр, не более.

Впрочем, кое-какие сравнения с оффлайном уже возможны. 6,4 10¹² МОПС, произведенных компьютерами общего назначения три года назад, уже вполне сопоставимы с числом нервных импульсов, производимых в секунду человеческим мозгом (10¹⁷).

Но это – всеми компьютерами Земли и одним полуторакилограммовым комком нейронов, функционирующим, скорей всего, совсем не по принципам двоичной логики, для которой все едино: что 10 Мб компрессированного текста, излагающего теорию струн, что 10 Мб компрессированного видео с клипом Леди Гага в паршивом качестве.

А ведь именно на такой логике, не различающей «арбузный» бит от бита «свиного хрящика», строятся пока что все попытки инвентаризовать производимую человеком информацию, в том числе и вышеописанное исследование, суммирующее банковскую транзакцию с пением соловья (принцип «нейтральности» всей информации оговорен авторами особо – он сослужил хорошую службу при подсчетах). Сумма дает большее число бит, но вот смысл составляющих теряется. Но если мы прекрасно отличаем хрящик от арбуза, а деньги от музыки, можно ли модель, подсчитывающую созданную нами информацию, научить различать в сумме битовые данные по смыслу? Если да, то такая «различающая» информационная модель различит, то есть осознает и самое себя – станет интеллектом.

В этом случае 295 миллионов терабайтных дисков, на которых цивилизация запишет все, что в состоянии записать, модель рано или поздно научится адекватно сопоставлять и с другими битами – содержащимися, например, во всех ДНК взрослого человека (10²³).

Двигаясь дальше, поскольку ее вычислительная способность будет возрастать

(бинарные алгоритмы, например, сменят рано или поздно квантовые, дающие гигантский прирост в производительности), она сопоставит их и с 10⁹⁰ бит, содержащимися в видимой части Вселенной, а также с 10¹²⁰ логическими операциями, произведенными природой над этими битами за 13,5 млрд лет с момента ее рождения. Быть может, и здесь нет абсолютно ничего запретного с точки зрения физики и вычислений, кто-то уже совершил такое сопоставление мира со своей моделью. К сожалению, нельзя исключать и вероятность того, что мы живем в одной из таких моделей, где способность создания искусственного интеллекта, способного вычислить «изначального» программиста методом сопоставления данных, специально не заложена в ее программу.

Читать полностью: http://www.gazeta.ru/science/2011/02/14_a_3524166.shtml