Карл Маркс и большие данные - страница 11
Революция больших данных протекает на наших глазах и будет определять социальные отношения, политическое устройство, образ жизни всей эпохи. Сегодня мы наблюдаем лишь первые лучики ее рассвета (о которых речь пойдет дальше), но и они уже поражают общество своей новизной, ученых — своей глубиной, а бизнес — своей ценностью.
Данные и информация
Чтобы окончательно разобраться с пониманием революции больших данных, нужно определиться с ее ключевыми понятиями, какими являются данные и информация. Информация является одним из наиболее дискуссионных феноменов последних пятидесяти лет, ввиду чего имеет огромное множество определений в зависимости от подхода, контекста, научной парадигмы и прочих факторов. Поэтому, прежде всего, стоит оговориться, что описываемые определения информации и данных не претендуют на роль строгого и универсальногопонятия, а нужны нам для полноты и наглядности описания революции больших данных и ее социальных последствий.
Итак, данные сами по себе в общем смысле являются набором зафиксированных на бумаге, в человеческой памяти, на цифровом носителе или еще каким-либо образом фактов. При этом любой факт сам по себе имеет смысл только в системе фактов.
Например, сам по себе факт того, что вес Проксимы Центавра составляет 2,446Е29 килограмма, ничего не скажет человеку, мало интересующемуся астрономией. Если же мы включим описанный факт в систему фактов, например, что вес этого красного карлика и ближайшей к нашему Солнцу звезды составляет 0,123 солнечной массы, эти данные обретут смысл и станут информацией. Теперь читатель может сделать вывод о том, что Проксима Центавра примерно в девять раз меньше Солнца и является не такой уж крупной звездой. При этом, чтобы сделать подобный вывод, читатель также прежде включит новые сведения в собственную систему данных, базирующуюся на представлениях о размере Солнца, школьных знаниях математики и астрономии, рассказах родителей, популярных фильмах и многом другом.
Информация, таким образом, есть данные, включенные в систему фактов и потому обретшие смысл. Иногда описанную нами схему также дополняют «знанием» как результатом обработки и структурирования информации и глубинными знаниями (или мудростью) как вершиной пирамиды информации. Подобный подход к определению информации был сформулирован в конце 80-х годов прошлого века и называется моделью DIKW (data, information, knowledge, wisdom). Впрочем, В.И. Ленин еще в 1908 году писал, что «в теории познания, как и во всех других областях науки, следует рассуждать диалектически, т.е. не предполагать готовым и неизменным наше познание, а разбирать, каким образом из незнания является знание, каким образом неполное, неточное знание становится более точным и более полным»>15.
На протяжении всей своей жизни человек оценивает происходящее и принимает решение, опираясь на информацию, получаемую в результате включения новых данных в систему «больших данных», собранных нашим мозгом за весь предшествующий период. Обобщая информацию, человеческий мозг находит в ней корреляции и зависимости, например, ребенок замечает, что плачем он привлекает к себе внимание. Как мы уже говорили, с развитием цивилизации появились средства накопления, обработки и обмена информации, люди научились сохранять ее для потомков. Например, развитие науки в широком смысле включает в себя сбор данных, включение их в релевантную систему информации (научных знаний) и закрепление их в качестве новой информации в системе научных знаний.
Человеческий мозг обладает и рядом недостатков: способен забывать и терять информацию, может ошибаться в расчетах и найденных зависимостях, хранит относительно небольшие массивы информации. В нашем веке на помощь ему приходят технологии и компьютеры, имеющие возможность хранить огромные объемы данных и обрабатывать их в миллионы раз быстрее человека. Однако для использования компьютером информация обязательно должна быть записана в цифровом формате, т.е. внешний мир должен быть сперва датифицирован и сохранен в виде набора цифровых данных.
В начале научно-технической революции середины ХХ века компьютер помогал человеку в основном в узкоспециализированных направлениях науки, люди собирали необходимые данные и вводили их в компьютер. С началом новой информационной эры количественный объем собираемых и накопленных данных и технологические возможности их обработки вышли на новый уровень, войдя в повседневную жизнь, став составляющей жизни каждого человека.