ДМИТРИЙ СЛИНЬКОВ
Анимированная статистика своими руками
«Мир нельзя постичь без цифр. Но мир и нельзя постичь, основываясь только на цифрах.»
― Hans Rosling, «Factfulness»

Мы ошибаемся: всё гораздо лучше, чем кажется
Шведский ученый выходит на сцену. Что-то говорит с чудовищным акцентом. Просит публику нажать на кнопочки брелков — проголосовать за тот или иной вариант ответа на самые обычные вопросы:

— Как изменилось число смертей от стихийных бедствий за последнее столетие?
— Сколько лет школьного образования получила среднестатистическая 30-летняя женщина мира?
— Как за последние 20 лет изменился процент людей в мире, проживающих в условиях крайней бедности?

Вопросы как вопросы. Проблема в том, что слушатели отвечают через свои брелки… хуже обезьян. Виной тому — предубеждения. Все читают заголовки газет. А заголовки придумываются исключительно для того, чтобы газету покупали.

Вот он берет огромную, не лазерную, а деревянную указку и бегает с ней за внезапно ожившими на слайдах фигурами. Получается экшн. Пусть выглядит это не только весело, но и грустно. Получается, что для мыслей о будущем нашей планеты мы все еще не созрели. Нам мешает невежество.

Вот на сцену выходит сын ученого и объясняет четыре простых принципа, которыми нужно руководствоваться в следующий раз, когда вас спросят: «Опасна ли для человечества акула». Конечно опасна, но не для человечества, а для случайно оказавшегося в ореоле её обитания одного несчастного человечка.

И так во всем: наши жены считают, что количество педофилов выросло драматически. Зеленые уверены, что мир погряз в мусоре. Пацифисты настаивают на том, что количество смертей от войн на земле растет в геометрической прогрессии.

Вывод? Он неожиданный: ни тем, ни другим, ни третьим доверять стратегию развития человечества нельзя. А кому можно? Конечно же не журналистам. Осмелюсь предположить, что те, кто любит настоящие, горячие, сочные данные — именно за такими индивидами будущее в прямом, а не в пропагандистском, смысле.

Ханс Рослинг (тот самый ученый с огромной указкой) основал движение Gapminder. Gap – это не одёжный бренд, а пропасть. На одном обрыве этой пропасти наши предубеждения помноженные на незнания. На другом — факты.

Факты нужно доказывать наглядно. Они буквально лежат у нас под под подушечками пальцев. Ханс даже создал программное обеспечение — совершенно бесплатное и мультиплатформенное. Вы сами можете его скачать и делать столь же интересные презентации. Посмотрите выступления Ханса. Однажды он выявил вспышку konzo, заболевания, вызывающего паралич.
Личный опыт использования Gapminder
Чтобы познакомиться с инструментом Gapminder, я поставил себе задачу: проанализировать зависимость уровня безработицы в РФ от количества студентов.

Взял данные Росстата — в сети можно найти либо отчет за любой год в pdf-формате, либо таблицы в формате MS Word. Разумеется, нужно брать Word, чтобы легче было конвертировать данные в единую Excel-таблицу. Выбрал показатели безработицы разбитые по всем субъектам РФ и выраженные в проценте от трудоспособного населения субъекта.

Количество студентов, для объективности, взял в относительном выражении — в пересчете на 10 тысяч населения субъекта.

Вот так выглядела исходная информация в Word:
Предстояло выполнить следующие, с виду простые, шаги:

1. Конвертировать таблицы Word в Excel
2. Сопоставить годы
3. Преобразовать Excel-таблицу в формат Gapminder
4. Загрузить получившийся Excel в Gapminder и наслаждаться визуальной анимированной статистикой.

Самым сложным из перечисленного был, конечно же, первый шаг. По-видимому, никто не предполагал, что данные Росстата кто-то захочет визуализировать. Таблица в таблицу копируется в два клика, но в результате получаются десятки объединенных ячеек, наименований групп строк и так далее. Всё необходимое преобразование приходилось делать вручную. Я уж не говорю о том, что в Word-е лежит не единая таблица, а разбитая на страницы. То есть, каждую страницу нужно было копировать отдельно. А еще была возня с кодировками символов…

В общем, расстояние от Росстата до конечной таблицы (см. скриншот ниже) было около часа.
Что получилось в итоге — судите сами по видео ниже:

Размеры кружков — безработица в регионе.
Цвет — год. Легенда цветов видна в правом верхнем углу. Там же видно, что данные рассматриваются с 2005 по 2016 год.
Отдельно трекаются Ингушетия (у них одно время была безработица аж 63%) и Москва.
Но все эти параметры, разумеется, можно настраивать в любой момент.
Что, кстати, дали цифры
Из обнаруженного в результате эксперимента:

1) безработица все эти годы действительно падает, не смотря на кризисы
2) количество студентов ВЕЗДЕ стремительно уменьшается (очень небольшой рост был только в Крыму и Чечне)
3) самые большие сокращения студентов (более чем в ДВА раза) произошли в: Мурманская область, Еврейская автономная область и Камчатский край.
«Существует парадокс: никогда раньше настоящее лицо нашего опасного мира не было таким эффективно распиаренным, но сам мир еще никогда ранее не знал столь низкий уровень насилия и столь высокие показатели безопасности.»
― Hans Rosling, «Factfulness»
Хотите заказать разработку управленческой отчетности?