Визуализация данных может быть полезна еще на этапе их анализа. Когда мы представляем данные в графическом виде, это позволяет нам буквально увидеть их и найти в них закономерности и тенденции, которые лягут в основу журналистской истории. Рассказываем о том, как визуализировать данные в Google Spreadsheets.
Первый способ визуализировать данные – это раскрасить ячейки в зависимости от какого-то правила. Сделать это позволяет условное форматирование. В одной из частей расследования «Важных историй» о мусорной реформе мы использовали данные Росстата о количестве вывезенных отходов из городов разных регионов. Для примера, выделим данные по России за разные годы, нажмем «Формат» – «Условное форматирование», перейдем на вкладку «Градиент» и выберем опцию, которая покажет нам самые высокие значения зеленым, а самые низкие белым. Так мы увидим, что самое большое значение за эти годы относится к 2019 году.
Условное форматирование можно применять и для отдельных столбцов. Выделим данные только за 2019 год по регионам и применим условное форматирование с правилом «от красного к зеленому через белый». Тогда мы увидим, что абсолютный лидер – это Москва (ячейка самого яркого зеленого цвета), а меньше всего твердых коммунальных отходов было вывезено из Чукотского автономного округа (ячейка самого яркого красного цвета).
Если мы применим условное форматирование на тех же данных за 2019 год в пересчете на 1 городского жителя регионов, самым ярким зеленым цветом окрасится ячейка с данными по Севастополю, самым ярким красным – данные по Чечне.
Условное форматирование можно применять и для всей таблицы. Для этого необходимо выделить всю таблицу, нажать «Формат» – «Условное форматирование» и выбрать то же правило. Мы увидим, что самое большое значение за этот период пришлось на Приморский край в 2015 году, и например, что у Чечни во все годы сохранялись стабильно низкие показатели.
Можно задавать отдельные условия для раскрашивания ячеек. Например, посмотреть, в каких регионах в 2019 году значения превышали среднее по стране. Для этого надо выделить необходимые данные и выбрать правило «Больше», а в ячейку под ним вставить среднее значение, рассчитанное ранее. Цветом выделятся ячейки только тех регионов, значения в которых превышают среднее по стране.
Еще один способ быстро оценить большое количество данных – построить мини-диаграммы в ячейке рядом с данными. Сделать это помогает функция SPARKLINE. Чтобы воспользоваться ей, нужно прописать в ячейке рядом с данными =SPARKLINE(), а в скобках указать диапазон данных. Например: =SPARKLINE(B3:F3). Тогда в этой ячейке появится мини-график, иллюстрирующий колебания в данных.
Можно задавать дополнительные параметры для этой функции: например, цвет и толщину линии. Например, следующая формула изменит цвет графика на красный и сделает его крупнее: =SPARKLINE(B3:F3;{"color"\"red";"linewidth"\2}).
Кроме этого, можно менять вид графика. Например, для столбчатой диаграммы параметры функции будут выглядеть так: =SPARKLINE(B3:F3;{"charttype"\"column"}). Подробнее обо всех особенностях этой функции можно прочитать в этой справке. Такое представление данных позволит быстро найти аномалии, тенденции или сравнить регионы друг с другом.
Если вывод уже найден и мы хотим изобразить его графически для публикации, в Google Spreadsheets можно создать полноценную визуализацию данных. Google Spreadsheets предлагают разные виды визуализаций: графики, столбчатые или круговые диаграммы и даже карты.
Чтобы построить любую диаграмму, надо выделить таблицу с данными, нажать в главном меню «Вставка» – «Диаграмма». Справа на странице появится Редактор диаграмм. В нем можно выбирать тип визуализации, менять стиль диаграммы, задавать заголовок, подзаголовок, названия осей диаграммы, работать с легендой и сеткой. Когда диаграмма готова, ее можно выгрузить в одном из форматов или опубликовать для встраивания на сайт с помощью кода.
Для примера в видео мы пошагово строим один из графиков, опубликованных в исследовании «Важных историй» о том, как введенные российскими властями ограничения для иностранных усыновителей сказались на сиротах. Данные для него можно найти здесь.