Статистические данные

Банк статистических данных о 90-х содержит Excel-файлы
с таблицами временных рядов
Перейти к поиску
Для адекватной работы ресурса используйте компьютер, в мобильной версии сайта некоторые функции могут быть не доступны.

БСД (банк статистических данных)

Статистика – это оружие и в честной, и в нечестной борьбе «мнений», даже если это не политическая публицистика, а научные исследования. Вот простой пример: два журналиста, один – сторонник Лужкова, другой – его противник, пишут в середине 1993 года об одной и той же «статистике». Сторонник заявляет: «… 80% москвичей живут в отдельных квартирах!», рассматривая это как успех градоначальника, а противник с таким же пафосом восклицает: «Каждый пятый москвич живет в коммуналке!». Оба используют одну и ту же статистику, не информируя читателя, что эти данные никак не характеризуют деятельность Лужкова – эта информация была использована им для заявления своих позиций о реформе ЖКХ, продвижение которой Лужков осуществил лишь в 2001 году при поддержке Грефа (её результаты весьма спорны).

В исследованиях по истории 90-х важную роль играет и будет играть статистика, без которой трудно оценить изменения в экономике, в обществе, в повседневной жизни людей, понять место России среди других стран. Могут сказать, что это так, и зачем ещё одно хранилище данных, если есть БД Росстата, есть ЕМИСС (Единая межведомственная информационно-статистическая система, в которую поставляют данные 62 ведомства), имеются огромные международные БД (ООН, МВФ, Мировой банк, Евростат и «куча» других). И всё же вся эта невообразимая по размеру совокупность статданных разных лет, разных стран и самых разных показателей мало пригодна в исходном виде для того, чтобы с ее помощью разобраться в происходившем и происходящем.

Дело в том, что используемые в реальных исследованиях статистические данные должны быть легко доступными, иметь «паспорт» источника (кто, когда и по какой методике собрал эти данные), должны быть сопоставимыми при сравнении разных лет и разных стран, одинаково называемые показатели должны означать одно и то же. И, одновременно, статистические данные должны быть представлены в удобной для использования форме, т.е. должны быть преобразованы в легко читаемые и осмысливаемые таблицы, графики, диаграммы. В то же время даже такой фундаментальный показатель как ВВП (Внутренний Валовой Продукт) или, что тоже самое, GDP (Gross Domestic Product) сплошь и рядом имеет существенные различия в разных БД. Например, ВВП (GDP) России в миллиардах долларов в 1994 оценен Росстатом, МВФ и Мировым банком следующими значениями: 172, 298 и 395 соответственно, – различия очень весомы – Росстат даёт значение на 42,28% меньшее, чем МВФ, а Мировой банк завышает данное МВФ значение на 32,55%.

В дополнение к указанным проблемам согласования данных из разных источников и придания им удобной для пользователей формы создание Банка Статистических Данных (БСД) рассматривается как платформа для разных научных исследований, например, для оценки результативности проводимых в 90-х годах реформ в сопоставлении их с реформами в других странах. Для этого, как правило, стандартные данные официальной статистики или стандартные данные экспертных опросов оказываются мало пригодными, нужна профессиональная работа по агрегированию разных статистических показателей в некие интегральные характеристики.

В настоящее время наш банк статистических данных готов к общей эксплуатации (вы имеете дело уже с третьей версией). Мы надеемся, что БСД можно рассматривать как инструмент исследования, который окажется:

  • удобным подспорьем для авторов любых статей и книг по истории 90-х;
  • доступным и удобным источником для всех, кто будет изучать 90-е – ученых, студентов, аспирантов, журналистов и просто любопытствующих, даже в том случае, если они не обладают высокой квалификацией в сфере статистических исследований;
  • хорошей базой для создания мощного хранилища статистических данных о России.

БСД – это открытое для всех хранилище статистических данных о России 90-х годов, нацеленное на исследование этой эпохи, а потому рамки собранных и собираемых данных гораздо шире, чем Россия в 1990-2000 годах. В БСД представлена разнообразная статистика практически по всем странам мира вплоть до 2014 года и, если такая статистика существовала и была доступна, то и за 1985-1990 годы.

Наш банк статистических данных снабжен удобной и понятной системой поиска нужных сведений. Это и контекстный поиск (по слову или словосочетанию), и по годам, и по категориям, которые позволяют выделять тип статистических данных, их источник и тематическую принадлежность. К числу категорий добавлена ещё принадлежность статистической информации к той или иной группе данных, обладающих некоторым общим свойством с точки зрения проведения различных исследований. На 1 января 2020 года в БСД всего 166 единиц хранения, что может показаться слишком скромным по сравнению с только что высказанными заявлениями. Но это действительно лишь кажущаяся скромность, поскольку большинство файлов в формате Excel являются сами по себе обширными базами данных.

Чтобы не быть голословным, рассмотрим для примера файл с тематическим именем «ВНП (валовой национальный продукт) на душу населения по ППС». В нём 4 листа: (1) «info» - краткие сведения о составе файла; (2) «RF and CIS» - данные для стран, входящих в СНГ; (3) «RF WP countries and Baltic» - данные для стран-участниц Варшавского договора и Прибалтики; (4) «BRICS countries» - такие же временные ряды вплоть до 2014 года для 5-ти стан из БРИКС. Каждая таблица сопровождается графической иллюстрацией сравнительной динамики ВНП всех стран из соответствующей таблицы.

И ещё один пример. В БСД под поисковым именем «Полицейская и судебная статистика, БД ООН ...» с указанием интервалов лет «1995-1997» и «1998-2000» вместо многоточия хранятся 2 файла, «7th all 040331.xlsx» и «cs_2001_06_27.xlsx», каждый из которых представляет интерактивную БД в среде Excel, содержащую данные за указанные года о 151 показателе практически для всех стран мира.

Все единицы хранения в БСД можно по их содержанию и формату разделить на следующие типы:

  1. Источники статистических данных (сведения о других банках и базах данных) – это самый простой тип данных, состоящий из ссылки на источник. Примерами источников могут быть Росстат и ООН.
  2. Базы статистических данных – это файлы в формате Excel, в которых данные организованы так, что они сопоставимы и удобны для дальнейшего статистического исследования. Часто они будут результатом нашей собственной работы с источниками, описанными выше, но будут также и подобные файлы, подготовленные не нами, но всегда с указанием авторства или открытого и доступного источника данных.
  3. Визуализации статистических данных – это также файлы в формате Excel, в которых наряду с фрагментами баз данных (см. выше) будут содержаться графики и диаграммы, образующие визуальные представления некоторых закономерностей, которые можно извлечь из приводимых данных. Любой пользователь может вставлять эти рисунки в свои исследования, ссылаясь на наш БСД.
  4. Аналитические доклады – это тексты в pdf-формате, содержащие результаты исследований, опирающихся на статданные. Их наличие в БСД обусловлено тремя причинами: (1) упрощение научной коммуникации между исследователями, применяющими статистические методы; (2) повышение статистической квалификации пользователей БСД; (3) пояснение некоторых терминов, понятий, методик, смыслов. Это значит, что мы будем размещать только доклады, которые удовлетворяют этой цели.
  5. Обучающие данные - это такой тип материалов в pdf-формате, который содержит набор информации по статистике: лекции, эссе на различные темы, посвященные статистическому анализу, примеры исследований и рассуждений, доклады и книги, полезные для тех, кто интересуется статистикой и не только.

В дополнение к представленным выше типам информации в нашем хранилище почти каждый файл (больше 96%) снабжен кратким описанием, pdf-файлом, в котором даются необходимые пояснения к основному источнику статистической информации. Такого же рода описания имеются и у групп в категории «Группы».

Более подробно с содержанием БСД и с использованием хранящихся в нём статистических данных можно познакомиться, щелкнув по надписи «? Помощь» в верхней части этой страницы. Там же в самом начале есть указатель Скачать инструкцию в формате pdf, для скачивания этого материала.

Мы открываем данную версию банка статистических данных для общей опытной эксплуатации. Мы ждем ваших предложений и замечаний. Мы также открыты для сотрудничества: если кто-то хочет предложить для размещения в нашем банке свои данные или результаты их анализа, милости просим. Вы можете присылать свои соображения и предложения по адресу darya.kas@gmail.com.

Перейти к поиску