Журналистика данных, часть 1. История

Обзор основных этапов в истории дата-журналистики в мире и России

Дата
5 нояб. 2021
Автор
Редакция
Журналистика данных, часть 1. История
«Атлас диаграмм по экономическим вопросам» И.Озерова, 1909

Дата-журналистика на русском языке — относительно новое явление, и по-прежнему даже в медиа не все знают, что это такое. Чтобы восполнить этот пробел, мы решили посвятить пару мастерских обсуждению журналистики данных.

Какие медиа первыми начали делать дата-материалы? Кто и за что получил первые международные премии? Растет ли спрос на дата-журналистов? Чем дата-журналистика на русском языке принципиально отличается от англоязычной?

Мы подготовили этот обзор вместе с образовательной компанией «Нетология», где есть курс по журналистике данных. В первой части расскажем о зарождении этого направления в мире и России, а во второй — поговорим о трендах, о будущем дата-журналистики и о том, где и чему учиться и где работать.

Почему журналистику данных называют профессией будущего 

Дата-журналистами называют тех, кто в дополнение к традиционным журналистским навыкам умеет работать с данными: знает основы статистики, анализа данных и программирования и использует все это в своей работе. 

В 2020 году издание РБК включило журналистику данных в список 100 профессий будущего, которые находятся на стыке разных дисциплин и будут востребованы в ближайшие 30 лет. 

Связано это с тем, что объем информации в мире постоянно растет, данные накапливаются — и нужны люди, которые могут делать выводы на основе данных и представлять их аудитории в понятном и удобном виде. Умение рассказать историю на основе данных — главный навык дата-журналистов. 

В более широком понимании эту сферу называют дата-сторителлинг. Дата-сторителлеров и дата-журналистов отличает от аналитиков данных именно умение найти интересную тему в данных, проанализировать их, написать текст или спродюсировать видео. Такие специалисты могут работать не только в медиа, но и в бизнесе, в некоммерческих и государственных организациях, потому что в них тоже все чаще требуются люди, которые умеют извлекать из данных смыслы и истории. 

Зачем нужна журналистика данных 

Новости сыплются на нас каждый день, и за ними трудно понять, какие процессы на самом деле происходят в обществе. С помощью журналистики данных можно взглянуть на социальные проблемы системно, а не с точки зрения разрозненных фактов и отдельных историй. 

В зарубежной практике много примеров, когда дата-журналистика и расследования приводила к большим изменениям. В силу политических причин в России дата-журналистика редко напрямую приводит к каким-то действиям со стороны государства, но она подсвечивает системные проблемы, вызывает резонанс и делает незаметное очевидным. 

Например, в 2019 году благодаря расследованию «Новой газеты» и «Медиазоны» (Минюст признал «Медиазону» иностранным агентом) «Я тебя сейчас, сука, убивать буду» мы узнали о колоссальном масштабе домашнего насилия в России. Авторы выяснили, что большинство осужденных за убийство женщин защищались от мужей или сожителей. Тогда директор центра помощи жертвам домашнего насилия «Насилию.нет» (признан Минюстом иностранным агентом) Анна Ривина отметила, что несмотря на то, что правозащитники и раньше знали о такой проблеме, у них не было цифр и фактов, чтобы предъявить это органам власти и показать реальные масштабы домашнего насилия. Теперь эти цифры есть. 

Расследование «Важных историй» о том, как полицейские с помощью «штатных» понятых фальсифицируют уголовные дела, впервые доказало массовость этой практики, о которой многие догадывались. Расследования о том, как власти скрывают число заболевших и погибших от коронавируса (например «Медиазоны», «Холода» и «Медузы» (признана Минюстом иноагентом), «Новой газеты»), напоминают людям, что пандемия еще не закончилась и нужно быть осторожными. 

Несмотря на отсутствие прямой обратной связи, журналистика данных помогает лучше понять, как устроено наше общество и что с ним происходит. А понимание — это уже шаг к изменениям.

Развитие дата-журналистики на английском языке

Дата-журналистика в России и других странах опирается в первую очередь на опыт изданий из США и Великобритании, поскольку они стали пионерами в этой области и до сих пор задают стандарты работы. Поэтому начнем рассказ с англоязычной дата-журналистики.

Оговоримся, что наш обзор не претендует на полное изложение истории журналистики данных. О мировом опыте уже написаны целые книги (например, вот или вот), а о русскоязычной дата-журналистике кому-то еще предстоит написать. Мы же остановимся только на некоторых этапах.

Докомпьютерная эпоха. Первые графики и публикации

В поисках истоков журналистики данных можно зайти очень далеко в прошлое. Дата-журналистика ассоциируется в первую очередь с инфографикой и визуализацией данных, а они существовали еще до нашей эры. Авторы проекта Milestones предлагают считать первым образцом графического представления информации карту города Конья (сейчас это Турция) шестого тысячелетия до нашей эры. 

Карта города Конья, 6200 год до н.э. Считается самой древней картой. На ней изображены 80 домов, а сверху — извергающийся вулкан
Карта города Конья, 6200 год до н.э. Считается самой древней картой. На ней изображены 80 домов, а сверху — извергающийся вулкан
Milestones Project

Однако графики в том виде, в каком мы привыкли их видеть, начали появляться в 19-м веке, когда стала накапливаться демографическая, медицинская и экономическая статистика.

В конце 18-го века шотландский экономист и инженер Уильям Плейфэр изобрел самые популярные сейчас виды визуализации данных — столбчатую диаграмму, линейный график и пайчарт (круговую диаграмму). Их можно встретить почти в каждом дата-материале. 

Линейный график Уильяма Плейфэра, 1786. Показывает соотношение торгового баланса (соотношение экспорта и импорта) между Англией и Данией&Норвегией
Линейный график Уильяма Плейфэра, 1786. Показывает соотношение торгового баланса (соотношение экспорта и импорта) между Англией и Данией&Норвегией
Столбчатая диаграмма Уильяма Плейфэра, 1786. Показывает торговый баланс (соотношение экспорта и импорта) между Шотландией и другими территориями
Столбчатая диаграмма Уильяма Плейфэра, 1786. Показывает торговый баланс (соотношение экспорта и импорта) между Шотландией и другими территориями

В 18-м веке были опубликованы две очень важные визуализации, которые буквально спасли жизни людей. 

Первая — карта распространения холеры врача Джона Сноу. В 1854 году в Лондоне вспыхнула холера. Тогда считалось, что она передается воздушным путем. Но лондонский врач Джон Сноу нанес на карту случаи заражения в районе Сохо и пришел к выводу, что источником заражения была колонка для подачи водопроводной воды. Закрыв колонку, удалось остановить заболеваемость. Исследование Сноу внесло большой вклад в эпидемиологию.

Карта распространения холеры в Лондоне врача Джона Сноу, 1854. Черным отмечены случаи заболевания. Эта карта позволила понять, что холера передается не воздушным путем, как думали раньше, а фекально-оральным путем через водопроводную систему, потому что случаи заболевания сосредоточились вокруг одной колонки для подачи воды
Карта распространения холеры в Лондоне врача Джона Сноу, 1854. Черным отмечены случаи заболевания. Эта карта позволила понять, что холера передается не воздушным путем, как думали раньше, а фекально-оральным путем через водопроводную систему, потому что случаи заболевания сосредоточились вокруг одной колонки для подачи воды

Другая важная визуализация — диаграммы сестры милосердия Флоренс Найтингейл, на которых она отмечала потери британской армии во время Крымской войны 1853–1856 годов. На диаграммах, которые теперь носят ее имя, она наглядно показала, что высокая смертность солдат связана не столько с боевыми ранами, сколько с антисанитарией. После публикации графиков в армии были проведены реформы, и смертей стало меньше.

Диаграммы сестры милосердия Флоренс Найтингейл, 1858. Показывают, как много смертей в армии вызваны не боевыми ранами, а антисанитарией
Диаграммы сестры милосердия Флоренс Найтингейл, 1858. Показывают, как много смертей в армии вызваны не боевыми ранами, а антисанитарией

Отсчет именно журналистики данных, а не только инфографики известный дата-журналист Саймон Роджерс предлагает вести с 1821 года. Тогда в пилотном выпуске британской газеты Guardian было опубликовано первое дата-исследование в медиа: таблицы с данными о численности учеников школ и средних расходах на обучение. После этой публикации впервые стало известно, сколько на самом деле детей в Британии учатся бесплатно: около 25 тысяч, хотя официальная статистика говорила о 8 тысячах. 

Фрагмент таблицы с численностью учеников школ в Англии и расходами на обучение, 1821. Считается первым примером дата-журналистики
Фрагмент таблицы с численностью учеников школ в Англии и расходами на обучение, 1821. Считается первым примером дата-журналистики
DataBlog The Guardian
Оцифрованный фрагмент той же таблицы 1821 года
Оцифрованный фрагмент той же таблицы 1821 года
DataBlog The Guardian

Любопытно, что попытки понять, насколько официальные данные отражают реальность, с первого дата-материала Guardian и до сих пор остаются одной из главных тем в журналистике данных. В России только за последний год вышло несколько таких публикаций: например, альтернативная хроника пандемии «Новой Газеты», проект «Медиазоны» о смертности врачей, исследование «Важных историй» о реальных масштабах производственных травм, расследования про фальсификации выборов и другие.

Вторая половина 20 века. Первые компьютеры и журналисты-социологи 

В 1967 году в американском Детройте произошли массовые беспорядки и погромы. Считалось, что в них участвовали в основном темнокожие малообразованные и безработные переселенцы с юга. Тогда журналист Филипп Мейер предложил изданию Detroit Free Press провести независимый опрос участников беспорядков, и его результаты оказались неожиданными. Выяснилось, что участие или неучастие в погромах не зависело от социального и экономического статуса людей. Люди с высшим образованием точно так же принимали участие в погромах, как и те, у кого его не было. А безработные южане, которых в первую очередь обвиняли в погромах, не сыграли в них большой роли. Эта публикация стала примером того, как журналистика данных может показать реальное положение дел и снизить социальную напряженность.

Сенсационная публикация Detroit Free Press об участниках беспорядков 1967 года, один из первых примеров применения методов сбора и анализа данных в журналистике
Сенсационная публикация Detroit Free Press об участниках беспорядков 1967 года, один из первых примеров применения методов сбора и анализа данных в журналистике
Philip Meyer

Через несколько лет журналист Филипп Мейер, автор опроса и статьи об участниках беспорядков в Детройте, написал книгу «Precision Journalism: A Reporter’s Introduction to Social Science Methods» («Точная журналистика: введение в методы общественных наук для репортеров»). Автор утверждал: чтобы журналистика действительно была объективной, репортерам важно владеть не столько художественным словом, сколько научными методами сбора и анализа данных, основами социологии и статистики. Филипп Мейер полагал, что в первую очередь это поможет лучше отражать проблемы меньшинств и угнетаемых групп общества. До сих пор множество дата-материалов построены именно на этой идее — показать неравенство на данных.

C конца 80-х годов и до сих пор журналистские расследования на данных вызывают большой резонанс. Например, в 1989 году Пулитцеровскую премию получил Билл Дедмен за расследование «Цвет денег» о том, как банки не дают кредиты темнокожим американцам с хорошими доходами. После этого Министерство юстиции обязало банки предъявлять одинаковые требования к заемщикам независимо от расы. В 1993-м победителем стал Стив Дойг за расследование «Что пошло не так?» о том, как непродуманное градостроительство повлияло на разрушения от урагана «Эндрю».

Инфографика из расследования Билла Дедмена «Цвет денег» (1988) о том, как банки не выдают кредиты темнокожим американцам даже с хорошими доходами
Инфографика из расследования Билла Дедмена «Цвет денег» (1988) о том, как банки не выдают кредиты темнокожим американцам даже с хорошими доходами
The Atlanta Journal-Constitution

Современность. Дата-журналистика — новый панк!

«Новым панком» журналистику данных провозгласил Саймон Роджерс, который начал вести DataBlog издания Guardian в 2009 году. Он сформулировал важные принципы дата-журналистики — прозрачность методологии и необходимость публиковать наборы данных целиком. В 2011 году Роджерс написал книгу Facts are sacred («Факты священны»), по-прежнему одну из главных в дата-журналистике.

Зарождение и стремительное развитие журналистики данных в ее современном виде в 2000-х годах связано, конечно, с распространением интернета. Можно выделить три фактора, которые оказали большое влияние на формирование дата-журналистики.

Во-первых, государства начали публиковать официальные открытые данные и статистику. 

Во-вторых, стали происходить утечки больших объемов информации, которые нужно было как-то обрабатывать и преподносить аудитории.

Подпишитесь на нашу рассылку
Мы будем присылать вам только важные истории

В-третьих, инструменты для создания дата-материалов с каждым годом становятся доступнее и проще: если десять лет назад анализом и визуализацией данных занимались в основном специалисты в этих областях — статисты, аналитики, дизайнеры, — то сейчас этими навыками может овладеть любой человек.

В 2010 году в Амстердаме прошла первая международная конференция по журналистике данных, после которой термин «дата-журналистика» начал упоминаться в научных статьях и на конференциях.

В том же году агентство Associated Press опубликовало серию сенсационных расследований о военных действиях США в Ираке. Журналисты проанализировали полмиллиона документов, полученных проектом Wikileaks, и визуализировали их с помощью графов и карт. Эти публикации показали огромный масштаб жертв в Ираке.

Через пять лет Международный консорциум журналистов-расследователей получил доступ к «Панамскому досье» — утечке 11,5 миллиона документов фирмы-регистратора офшоров Mossack Fonseca. В течение года 400 журналистов из 77 стран работали над расследованиями об офшорных компаниях глав государств, чиновников, политиков и олигархов. Российскую часть расследования готовили журналисты «Новой Газеты» Роман Анин, Олеся Шмагун и Дмитрий Великовский (все признаны Минюстом иноагентами) — впоследствии авторы «Важных историй». «Панамское досье» 2016 года стало самым крупным совместным дата-журналистским расследованием в мире. Во многих странах против упомянутых чиновников и влиятельных лиц были проведены расследования, президент Исландии лишился поста. Авторы «Панамского досье» получили Пулитцеровскую премию.

С тех пор происходило еще несколько крупных утечек данных об офшорах и финансовых операциях. В 2019 году было опубликовано расследование «Кошелек российской элиты» о выводе миллиардов рублей из России через серые схемы. Это стало громким событием в Европе, после которого банки были вынуждены пересмотреть подход к предотвращению «отмывания денег». Расследование получило главную награду в дата-журналистике — Sigma Awards

В 2021 году были опубликованы «Документы Пандоры», которые по объему слитых документов даже превзошли «Панамский архив». В расследовании обеих утечек участвовали журналисты «Важных историй».

Но несмотря на то, что расследования утечек информации вызывают большой общественный резонанс, чаще всего дата-журналистские материалы основаны не на них. Обычно источником служат официальные открытые данные, либо журналисты сами собирают наборы данных из разных ресурсов.

Об этом можно судить по дата-материалам, которые публикуют лидеры современной дата-журналистики. Это в первую очередь команды изданий New York Times, Guardian, Financial Times, Washington Post, Wall Street Journal, Pudding, Propublica, Bloomberg, Reuters. Именно на них ориентируются все дата-журналистские команды в мире.

New York Times, Guardian, Financial Times, Washington Post, Wall Street Journal, Pudding, Propublica, Bloomberg, Reuters
— главные англоязычные издания, которые делают журналистику данных

Также примеры лучших дата-материалов последних десяти лет можно найти на страницах дата-журналистских премий — Data Journalism Awards (до 2019 года) и Sigma Awards (c 2020 года). Среди работ, которые их получают, все чаще можно встретить дата-материалы на русском языке — об этом расскажем в следующей части. 

В 2020 и 2021 году главной для дата-журналистики стала тема пандемии. Многие СМИ изучали и визуализировали данные о заражениях коронавирусом, о смертности и вакцинации. Самый известный материал сделало издание Washington Post. Это симуляция пандемии, которая показала, как стремительно растет число заражений, когда люди не изолируются. Эта история стала самой просматриваемой за всю историю Washington Post. 

Другие резонансные примеры — исчерпывающий гид по вакцинации от Reuter Graphics, хронология пандемии в данных от Financial Times, обновляемый дашборд New York Times, трекер новых штаммов коронавируса и другие дата-материалы по теме пандемии.

Визуализация из интерактивного материала The Washington Post, который наглядно показал важность социальной изоляции. Эта публикация стала самой популярной за всю историю The Washington Post
Визуализация из интерактивного материала The Washington Post, который наглядно показал важность социальной изоляции. Эта публикация стала самой популярной за всю историю The Washington Post
Harry Stevens / The Washington Post, 2020

История дата-журналистики в России

Докомпьютерная эпоха. Инфографика царского и советского периода 

Несмотря на то что о журналистике данных в России начали говорить всего десять лет назад, а активно заниматься ей — меньше пяти лет назад, визуализация данных и печатная инфографика встречались намного раньше, минимум с 19-го века. 

Алексей Новичков, доцент Факультета коммуникаций, медиа и дизайна НИУ ВШЭ, экс-руководитель студии инфографики ТАСС, в своей лекции об истории российской инфографики начинает отсчет с научно-популярных журналов «Вокруг света», «Наука и жизнь» и «Огонек», где публиковались схемы различных технических изобретений.

Инфографика изобретения Пуатевена для проведения опыта по исследованию свойств цвета. Один из первых опытов использования инфографики в СМИ
Инфографика изобретения Пуатевена для проведения опыта по исследованию свойств цвета. Один из первых опытов использования инфографики в СМИ
Наука и жизнь, 1890, № 1
Инфографика с изображением красных кровяных телец (эритроцитов) в первом номере журнала «Огонек» в 1899
Инфографика с изображением красных кровяных телец (эритроцитов) в первом номере журнала «Огонек» в 1899
Огонек, 1899, № 1

В начале 20 века были изданы несколько сборников с визуализацией данных, созданных вручную. Их интересно рассматривать и сегодня. 

Сравнение госдолга разных стран
Сравнение госдолга разных стран
«Всеобщий географический и статистический карманный атлас» Издательства А.Ф. Маркса, 1908
Потребление чая на душу населения в Великобритании, Голландии, Германии, России и США
Потребление чая на душу населения в Великобритании, Голландии, Германии, России и США
«Атлас диаграмм по экономическим вопросам» Ивана Озерова, 1909
Профессии жителей Российской империи конца 19 века. Размер фигуры означает численность представителей определенной профессии. Большинство жителей Российской империи занимались сельским хозяйством
Профессии жителей Российской империи конца 19 века. Размер фигуры означает численность представителей определенной профессии. Большинство жителей Российской империи занимались сельским хозяйством
Сборник «Россия в цифрах» Николая Рубакина, 1912

Помимо статистических сборников и иллюстраций в научно-популярных журналах, в СССР инфографика использовалась как средство пропаганды. Она должна была наглядно показывать достижения молодого советского государства. 

Инфографика Изостата из альбома-выставки «СССР — страна равноправия женщин»
Инфографика Изостата из альбома-выставки «СССР — страна равноправия женщин»
Институт Изостат, 1938. Собрание ГПИБ / Фото с сайта Галереи на Шабловке

Журнальная инфографика 2000-х и начала 2010-х

В России начала нулевых если и были журналистские расследования на данных, то это были единичные случаи. В то время активно развивалась инфографика в журналах. В отличие от современной дата-журналистики в России, она была чаще на научно-популярные темы, чем на острые социальные, и почти не отражала новостную повестку.

По мнению Алексея Новичкова, если считать инфографику оформлением материалов дата-журналистики, то пионерами в этой сфере можно назвать журнал «Всё Ясно». Он существовал с 2004 по 2007 год и полностью состоял из инфографики. 

Также инфографикой занимались студия «Паровоз», газеты «Акция» и «Мой район», журналы «Русский репортер», «Большой город», «Вокруг света».

Хроника перелета немецкого пилота Матиаса Руста на лёгкомоторном самолёте из Хельсинки в Москву в 1987 году
Хроника перелета немецкого пилота Матиаса Руста на лёгкомоторном самолёте из Хельсинки в Москву в 1987 году
Журнал «Все ясно», 2007 / Фото агентства Infographer
Инфографика о политзаключенных в России
Инфографика о политзаключенных в России
Журнал «Все ясно», 2007 / Фото агентства Infographer
Журнал Русский репортер, 2010
Журнал Русский репортер, 2010

Дата-журналистика в России с 2011-го по настоящее время. Главные медиа, тексты и проекты 

РИА «Новости» и ТАСС

В 2010 году в Амстердаме прошла первая международная конференция по журналистике данных, а в 2011 году РИА «Новости» перевело пособие по дата-журналистике на русский язык.

«До этого момента всерьез об этой профессии никто не слышал. Подразумевалось, что есть специализированные журналисты в области науки или экономики, которые имеют бэкграунд работы с данными в рамках своего профиля, но вот заниматься расследованиями или сторителлингом, основанном на данных, специализировано ещё никто не начал», — говорит Алексей Новичков, доцент факультета коммуникаций, медиа и дизайна ВШЭ, с 2011 по 2014 год работавший заместителем руководителя студии инфографики РИА «Новости».

К 2012 году студия инфографики РИА стала одним из крупнейших инфографических бюро Европы и получала за свои работы награды на главных профильных конкурсах Information Is Beautiful и Malofiej.

Вскоре большие проекты по инфографике начал выпускать ТАСС. Проекты «Когда пришёл Наполеон», «Италия. История одного падения», и «Меркатор. О дивный плоский мир» — самые титулованные в истории российской мультимедийной инфографики.

Оба агентства, МИА «Россия сегодня» (до 2013 года — РИА «Новости») и ТАСС, делали и продолжают делать качественную инфографику (Алексей Новичков собрал их главные достижения в этой таблице). 

Но несмотря на то что именно РИА «Новости» первыми в России заговорили о журналистике данных, тематика их инфографики, как и инфографики ТАССа, была и остается познавательной и развлекательной, а не социальной и не расследовательской. 

«Мы смотрели на New York Times, Washington Post, Wall Street Journal, Bloomberg, — говорит Александр Богачев, который с 2014 по 2017 год был редактором и дизайнером студии инфографики МИА „Россия Сегодня“ (до 2013 называлось РИА «Новости»). — Я хотел, чтобы наши проекты были не только такими же красивыми, как у них, но чтобы они были такими же журналистскими — соответствовали актуальной повестке, имели социальную значимость. Но в РИА делать это было скорее нереально». 

Главными именно дата-журналистскими материалами РИА «Новости» опрошенные нами коллеги называли те, что касались Госдумы и выборов, — например «20 лет Государственной думы», «Конфигуратор государственной думы», наглядное объяснение механики голосования на выборах в Госдуму (до сих пор актуальное) и визуализация их итогов.

«Инфокультура», хакатоны и «журналистика данных» ВШЭ

Большую роль в развитии российской дата-журналистики сыграл основатель и директор проекта «Инфокультура» Иван Бегтин. Он добивался того, чтобы ведомства публиковали открытые данные в публичном доступе. 

Хакатоны — мероприятия, где команды из программистов, дизайнеров и журналистов в короткие сроки с нуля создают дата-материалы, — тоже повлияли на формирование индустрии. Многие дата-журналисты, которые сейчас работают в СМИ, начали путь в профессию с таких хакатонов. 

Первый хакатон по дата-журналистике прошел в феврале 2016 года. Среди его организаторов были проект «Инфокультура» и магистерская программа по журналистике данных НИУ ВШЭ.

Поддержите «Важные истории»
С вашей помощью мы сможем продолжать рассказывать истории о России — с данными и не только

В 2016 году прошел первый набор на эту программу. Среди первых студентов были Ирина Долинина и Алеся Мараховская (обе журналистки признаны Минюстом иноагентами; работали в дата-отделе «Новой газеты», сейчас в «Важных историях»), Соня Савина (РБК, а сейчас «Важные истории»), Дада Линделл (РБК).

РБК 

РБК стало одним из первых СМИ, которые начали заниматься не только инфографикой, а дата-журналистикой — то есть делать исследования на актуальные и социально значимые темы. Редактором отдела спецпроектов в 2017–2018 годах был Александр Богачев. Там же работали Соня Савина и Дада Линделл. 

«Каждое утро я читала ленту новостей и прикидывала, какую „горящую“ тему можно раскрыть через данные или интересно дополнить данными, чтобы выпустить заметку в тот же день», — рассказывает Соня Савина. Пример такого новостного материала на основе данных — публикация 2018 года о том, как во всех районах, где проходили «мусорные» протесты, результат действующего губернатора снизился по сравнению с прошлыми выборами. 

Среди множества дата-публикаций РБК Соня Савина отметила несколько наиболее интересных, на ее взгляд:

  • анализ публикаций в соцсетях с хештегом #засобянина перед выборами мэра Москвы в 2018 году, который показал, что подавляющую часть постов в поддержку Собянина писали сотрудники его избирательного штаба;
  • обновляемые графики о дипломатических конфликтах России с другими странами;
  • красочный спецпроект с результатами президентских выборов президента 2018 года в интерактивных визуализациях;
  • игра о том, как Россия жила при Путине.

Дата-журналистка Дада Линделл в 2019 году получила премию Data Journalism Awards за серию публикаций для РБК. В частности, за резонансное расследование о том, как в некоторых регионах России от ВИЧ умирают чаще, чем от убийств, суицида и ДТП, вместе взятых. Среди других больших расследований Дады — материалы о том, как в Москве меняют дорожное покрытие на одних и тех же улицах, как росли подмосковные свалки, как дорожали авиабилеты перед Чемпионатом мира и другие.

Обложка интерактивного проекта РБК об итогах выборов президента в 2018
Обложка интерактивного проекта РБК об итогах выборов президента в 2018
Александр Богачев, Дада Линделл, Софья Савина, Алексей Гаврилко-Алексеев, Евгений Николаев, Евгений Тонконогий, Александр Чиненов / РБК, 2018
Инфографика из расследования РБК о смертности россиян от ВИЧ
Инфографика из расследования РБК о смертности россиян от ВИЧ
Дада Линделл, Полина Звездина, Евгений Тарасенко / РБК, 2019

«Новая Газета»

В 2018 году «Новая газета» организовала хакатон, на котором набрала первый дата-отдел в российских СМИ. До этого были отделы спецпроектов, инфографики, но дата-отдела еще нигде не было. В него вошли Андрей Заякин, Алексей Смагин, Ирина Долинина и Алеся Мароховская. 

«Сначала было немного странно, потому что и сама редакция не понимала, что от нас нужно, и мы сами не понимали, — рассказывает Алеся Мароховская, сейчас редакторка дата-отдела „Важных историй“. — [Главный редактор „Новой газеты“] Дмитрий Муратов рассказывал, что, когда появился дата-отдел, к нему пришел отдел культуры в расстроенных чувствах с вопросом „Мы что, плохо делаем свою работу? Зачем вы наняли целый дата-отдел, чтобы освещать даты? Мы что, плохо даты освещаем?“ Иногда к нам приходили со странными просьбами что-то нагуглить: „вот вы же с компьютерами сидите, нагуглите нам“. Приходилось долго объяснять, что мы не отдел гугления, а немного другими вещами занимаемся. Накапливался какой-то негатив к нам, потому что „вы там со своими компами сидите, долго ничего не выпускаете, еще и гуглить не хотите“. Был этап какой-то притирки. Стало проще, когда мы получили Редколлегию [за расследование о насилии над детьми], тогда коллеги немножко оттаяли и поняли, что мы не просто сидим за компами и ничего не делаем, а это всё-таки приносит какой-то толк».

Расследования Алеси Мароховской и Ирины Долининой в 2018 и 2019 годах — «Кто поднимает Россию на дыбу» о пытках в колониях и «Я тебя и убью» о том, как в России смягчают наказание за издевательства над детьми, стали прорывными в плане работы с данными в журналистике. Они были сделаны на основе анализа судебных решений, в том числе методами машинного обучения. В дальнейшем судебные решения не раз становились основой дата-журналистских расследований.

Одним из первых материалов дата-отдела было расследование «ВИП-кочевники», где авторы проанализировали почти 60 тысяч чиновников и с помощью программирования нашли целые кланы, которые вместе переходят с одного места работы на другое — и захватывают с собой подрядчиков-земляков. 

С 2020 года в «Новой» работает уже второе поколение дата-отдела: Екатерина Бонч-Осмоловская, Артем Щенников, Арнольд Хачатуров и Антонина Асанова, у которых уже успело выйти много больших текстов. Например, расследование о том, что происходит с войной в Донбассе в 2021 году, на основе данных из самых разных источников, об эпидемии ВИЧ, о школьном питании в Москве, о не-расследовании убийств в Чечне и другие.

Кроме того, дата-отдел «Новой» запустил альтернативный трекер COVID-19, который позволяет лучше понять, что происходит с коронавирусом в регионах по данным об избыточных смертях и поисковых запросах.

«Медиазона»

Когда мы спрашивали у дата-журналистов, какие у них любимые примеры журналистики данных на русском языке, многие называли два проекта «Медиазоны» 2020 года — про смертность врачей от коронавируса и «Минск избитый» о том, как в августе 2020-го силовики калечили протестующих в Беларуси.

Помимо кропотливой работы с тяжелой темой и сложными данными, их отличают эмоциональные визуализации. Проект «Минск избитый» стал победителем Sigma.

Фрагмент инфографики «Медиазоны» о смертности врачей от коронавируса
Фрагмент инфографики «Медиазоны» о смертности врачей от коронавируса
Максим Литаврин, Давид Френкель, Никита Шулаев, Анна Козкина / Медиазона, 2020
Фрагмент инфографики «Медиазоны Беларусь» о том, как силовики калечили протестующих
Фрагмент инфографики «Медиазоны Беларусь» о том, как силовики калечили протестующих
Максим Литаврин, Давид Френкель, Егор Сковорода, Анастасия Бойко / Медиазона Беларусь, 2020

Специфика «Медиазоны» — дата-исследования о политических преследованиях, тюрьмах, судебной системе: путеводитель по политзаключенным после зимних протестов 2021 года или исследование о том, как по следам политических процессов и протестов меняют законодательство. 

Как и у «Новой газеты», у «Медиазоны» есть интерактивный дашборд по коронавирусу, где помимо официальной смертности от COVID-19 показана и избыточная смертность в регионах.

«Проект»

В августе 2021 года прокуратура признала издание «Проект» нежелательной организацией, и оно вынуждено было закрыться под угрозой уголовного преследования авторов. 

К сожалению, мы даже не можем дать ссылки на исследования «Проекта», где с 2018 по 2021 год публиковались качественные дата-исследования на самые разные темы — о том, как власти стремятся исправить статистику вместо того, чтобы решать проблемы, о загрязнении воздуха, о пожарах, о пытках в колониях, о нехватке мест в детских садах и другие.

«Важные истории»

С момента запуска весной 2020 года «Важные истории» делали расследования на данных, но для большей продуктивности и организованности осенью 2020-го появился целый дата-отдел. Можно сказать, что это самый крупный дата-отдел в России — в него входят пять человек.

В «Важных историях» собрались журналисты, которые уже имели большой опыт в журналистике данных, но решили немного изменить подход к историям. За год успели оформиться главные особенности дата-материалов, которые отличают «Важные истории» от других изданий, занимающихся журналистикой данных. 

Во-первых, помимо цифр, в них почти всегда есть личные истории людей из разных регионов страны.

Во-вторых, все чаще дата-истории выходят не только в тексте, но и в формате видео. 

В третьих, дата-журналисты в «Важных историях» многозадачны и проходят все этапы подготовки текста самостоятельно. 

«Если в РБК моей главной задачей было собрать и проанализировать данные, то теперь я отвечаю и за общение с героями материалов, и за производство визуализаций, — рассказывает Соня Савина. — А если история выходит не только в тесте, но и в видео, то пишу сценарий и работаю в кадре. У этого подхода есть свои плюсы и минусы: производство историй занимает у нас больше времени, но такое глубокое погружение в тему — от дата-раскопок до командировок по городам и селам — рождает качественные материалы, выполненные с любовью».

Ниже мы собрали несколько историй, где как раз хорошо видны эти особенности.

Исследования на данных о материнской и младенческой смертности, о сокращении мест в роддомах уже было бы достаточно, чтобы рассказать, почему в России страшно рожать детей. Но благодаря историям героев Соне Савиной удалось сделать об этом потрясающий эмоциональный текст и фильм в духе социальной дата-журналистики. 

Два этих расследования о том, как полицейские привлекают наркозависимых понятых, чтобы фальсифицировать уголовные дела по «наркотическим» статьям, уникальны методом работы с данными. Алесе Мароховской удалось с помощью программирования подтвердить то, о чем все догадывались, и найти в судебных решениях 86 подставных понятых, которые участвовали в 269 делах.

Граф связей понятых с полицейскими из расследования «Я свидетель. Кто помогает полицейским фальсифицировать уголовные дела за наркотики»
Граф связей понятых с полицейскими из расследования «Я свидетель. Кто помогает полицейским фальсифицировать уголовные дела за наркотики»
Алеся Мароховская / Важные истории, Иван Голунов / Медуза, 2021

«Мне самой нравится тот метод, который мы использовали, чтобы доказать фальсификации уголовных дел, — говорит Алеся. — Была такая проблема, которую примерно все понимали, но ее было практически нереально доказать документально именно массово. Можно было доказывать в каждом отдельном случае, [что понятые связаны с полицейскими], разбирая каждое дело, разговаривая с адвокатами и свидетелями. А тут удалось автоматизировать процесс и найти какой-то паттерн. Лично я обожаю такие истории, когда есть красивый метод решения. Мне нравится именно то, что с не самыми простыми данными удалось обойтись программным методом и массово доказать фальсификации».

В Самаре Алеся Мароховская и Ирина Долинина несколько дней общались с бывшими оперативниками и с теми, против кого они годами фальсифицировали уголовные дела, и сняли об этом мощный фильм.

Чуть больше года назад у «Важных историй» появились эксплейнеры в формате скроллителлинга. Вы скроллите вниз, а у вас меняются графики и выползает текст, который все объясняет. В формате скроллителлинга мы разбирались, правда ли население России сокращается из-за того, что женщины не хотят рожать, и каков был масштаб фальсификаций на голосовании по поправкам в Конституцию в 2020-м и на выборах в Госдуму в 2021-м.

Фрагмент эксплейнера «Колокол, пила, топор» о фальсификациях на голосовании по поправкам в Конституцию в 2020 году
Фрагмент эксплейнера «Колокол, пила, топор» о фальсификациях на голосовании по поправкам в Конституцию в 2020 году
Алеся Мароховская, Алексей Смагин / Важные истории, 2020
Фрагмент эксплейнера «Рожаем как богатые — умираем как бедные» о том, почему на самом деле в России сокращается население
Фрагмент эксплейнера «Рожаем как богатые — умираем как бедные» о том, почему на самом деле в России сокращается население
Алеся Мароховская, Полина Ужвак, Юлия Алыкова / Важные истории, 2020

Осенью 2020 Юлия Алыкова и Полина Ужвак сделали исследование о том, что в России разливы нефти происходят каждые полчаса. «Мне очень нравится исследование про разливы нефти, потому что в нем шокирующие выводы, и интересно, что никто не догадался сделать этого раньше, — говорит Алеся Мароховская. — Когда года четыре назад в Россию приезжал журналист Вадим Макаренко из польской „Газеты Выборчей“, он спрашивал, какие у вас материалы заходят лучше всего — наверное, экология? Мы тогда ответили, что какая экология, у нас в России никому дела нет до экологии и никто в эту тему не совался. Хотя на самом деле тема экологии в мире в дата-исследованиях очень важная. И я рада, что мы начали одними из первых заниматься этим в России». 

Чуть больше чем за год авторы дата-отдела «Важных историй» получили четыре премии «Редколлегия».

Помимо дата-команд «Важных историй», «Новой газеты», «Медиазоны» и РБК, материалы на данных, конечно, появляются и в других российских медиа. Например, у BBC резонанс вызвало расследование о том, как фермеры из Китая осваивают земли на Дальнем Востоке; у ОВД-инфо (признано иноагентом) — исследование и инфографика об иностранных агентах «Инотека»; в «Тинькофф Журнале», где работает дата-журналист Алексей Смагин, теперь тоже часто появляются исследования на данных. 

Что происходит с журналистикой данных в соседних странах

В Украине самое титулованное издание, которые публикует дата-журналистику, — Texty.org.ua. С момента его основания в 2010 году авторы начали делать визуализации данных, а уже в 2012 году вошли в шорт-лист первого международного конкурса журналистики данных Data Journalism Awards с поисковиком по базе госзакупок. В 2016 они сделали оригинальную игру «Деньги, метры, два автомобиля», где предлагали читателю угадать официальный доход чиновника исходя из недвижимости и автопарка, которыми он владеет. 

Другой резонансный проект Texty — «Земляная проказа», в котором журналисты с помощью спутниковых данных и машинного обучения нашли места незаконной добычи янтаря. В 2020-м Texty получили премию Sigma за проект по поиску дезинформации из России с помощью методов компьютерной лингвистики и за сервис для разоблачения фейков «Фейкогрыз».

В Центральной Азии дата-журналистика развивается в первую очередь в Кыргызстане, где работает годовая стипендиальная программа по дата-журналистике международной НКО Internews и Школа Данных Кыргызстан. Школа данных организует ежегодную международную конференцию по дата-журналистике на русском языке LAMPA. В 2020 году сразу в трех кыргызских изданиях — 24.kg, kaktus.media и kloop.kg — появились дата-отделы. 

В дата-отделе Kloop есть программисты, что позволяет делать сложные технические проекты. Например, «Лукошко» на основе машинного обучения. В него можно загрузить изображение любого политика и увидеть, как часто он мелькает на телевидении. Сервис «Кольца коррупции», созданный с помощью графов на основе объединенной базы госзакупок и зарегистрированных в Минюсте юридических лиц, позволяет в полуавтоматическом режиме выявлять коррупционные схемы.

Главный проект 2021 года — исследование масштабов фемицида (убийства женщин мужчинами на почве ненависти, гендерной дискриминации) в Кыргызстане «Я бы ее все равно убил», опубликованный в Kloop. По словам соосновательницы Школы Данных Кыргызстана, в прошлом главного ментора программы по дата-журналистике Internews Анастасии Валеевой, оно стало результатом многих лет работы по развитию дата-журналистики в Кыргызстане. Этот материал послужил основой для дискуссии о фемициде в Кыргызстане и всей Центральной Азии — и о том, как его остановить. Проект стал победителем международной премии по дата-журналистике Sigma.

Также Анастасия отметила дата-исследования о плачевном состоянии школ Кыргызстана и расследование о том, как Кыргызстан живет на деньги мигрантов.

Что дальше 

Во второй части нашего обзора дата-журналистики расскажем:

  • о сегодняшних трендах в российской дата-журналистике и о том, что ее ждет в будущем;
  • где и зачем учиться журналистике данных и где работать.

Поделиться