Я беспокоюсь о последнем километре в работе с данными. Как любитель решений, основанных на данных, возможно, вы тоже беспокоитесь.
Много тяжёлой работы было вложено в сбор требований и реализацию. Были сделаны дополнительные крупные инвестиции в усилия по проведению анализа, похожего на ниндзя. Конечным результатом стал сбор тенденций и идей.
«Последний километр» — это расстояние между вашими тенденциями и тем, чтобы влиятельный руководитель компании принял меры.
Ваш самый большой актив в преодолении «последнего километра» — это то, как вы представляете данные.
На слайде. На панели инструментов в Google Data Studio. Или просто что-то, что вы планируете набросать на доске. Эта презентация данных решит, будут ли ваши тенденции и идеи поняты, приняты и сделаны выводы о том, какие действия следует предпринять.
Если ваша презентация данных хороша, вы сокращаете «последний километр». Если ваша презентация данных запутанна/сложна/необузданна, вся тяжёлая работа, вложенная в сбор данных, их анализ, поиск контекста, будет напрасной.
Поскольку преимущества очевидны, вы можете подумать, что «последний километр» не является широко распространённой проблемой. Боюсь, что это не так. Я вижу отчёты, информационные панели, презентации с большими пробелами.
Сегодня ещё один взгляд на эту пагубную проблему и набор принципов, которые вы можете применить, чтобы преодолеть «последний километр», существующий на вашей работе.
Для наших сегодняшних уроков я использую пример, основанный на анализе, проведённом коллективными усилиями ведущего американского университета, ведущей мировой консалтинговой компании из пятёрки и крупной отраслевой ассоциации. Анализ общедоступен.
Я решил скрыть название участвующих организаций. «Последние километры» существуют во всех наших компаниях. Неважно, откуда взялся этот анализ 2018 года. В случае, если вы узнаете источник, я прошу вас не упоминать его в комментариях.
Для каждого из 17 примеров, которые мы рассмотрим, я поделюсь альтернативной версией, которую создал. Я приглашаю вас поиграть и поделиться своей версией любого из примеров. Я добавлю их в пост и укажу ваше авторство.
Готовы?
Пойдём!
Я настойчиво выступаю за простоту в слайдах. Не создавайте раздаточных материалов!
В этом случае цель состояла в том, чтобы создать раздаточные материалы, возможно, чтобы облегчить аудитории самостоятельное потребление данных. Я бы по-прежнему выступал за простоту, когда дело доходит до представления данных.
Некоторые исправления для упрощения могут включать использование меньшего количества украшений, более простого заголовка — графики и текста —, и мы можем быть очень избирательны в том, что разместить на слайде. Когда вы посмотрите на слайд, я уверен, вы придумаете другие способы освободить белое пространство от тирании текста/цветов.
Упрощение способствует эффективности коммуникации. Это, конечно, отражается на вашем бренде и, самое главное, помогает вам лучше контролировать историю, которую вы пытаетесь рассказать.
В остальной части этого поста я буду игнорировать простоту и элементы повествования и сосредоточусь исключительно на самих данных. Как, что, почему и вместо этого.
Посмотрите на график выше и на маленькую таблицу… Поразмышляйте немного о том, что бы вы сделали, чтобы преодолеть «последний километр» и помочь ключевому сообщению засиять.
Вот некоторые вещи, которые мне бросились в глаза:
1. Выбор графиков может преувеличивать или недооценивать реальность.
Один из способов преувеличить — начать ось Y с 40, как в случае, представленном выше. Получившаяся линия преувеличивает тенденцию и в итоге подразумевает то, чего, возможно, на самом деле нет.
Начните с нуля. Пожалуйста.
2. Ложная точность может привести к беспорядку и подорвать гениальность аналитика.
Это очень тонко.
Вы заметите, что числа на графике выражены с одним знаком после запятой. Как в 47,7, 56,5 и т. д. Если вы остановитесь и подумаете, как эти данные собираются, через небольшой трёхзначный образец результатов опроса, сообщаемых респондентами, вы быстро поймёте, что диапазон погрешности в этих данных, вероятно, составляет несколько пунктов. Если это правда, то показ 0,6, 0,5 подразумевает точность, которой просто не существует.
Кроме того, эта ложная точность также загромождает график.
3. Удалите отвлекающие факторы, безжалостно.
За 11 лет каждая точка данных намного менее важна, чем тренд. Нужны ли вам точки на графике? Нужны ли вам числа за отдельные месяцы?
Когда дело доходит до преодоления «последнего километра», полезно иметь безжалостную жилку. Полезно, потому что ради нашей конечной цели вам придётся убить некоторые из своих любимых вещей, вам придётся противостоять своему начальнику/коллегам, которые могут любить беспорядок, и вам, возможно, придётся помочь изменить всю культуру. Тяжёлая, болезненная работа. Но она того стоит.
Вот альтернативный способ представить данные, используя не более чем стандартные настройки в старом добром Excel:
Он просто показывает тренд. Вы можете увидеть, что он в целом вырос за одиннадцать лет. Что он был ниже 50, а теперь близок к 70.
Заметили ли вы, что тренд не так преувеличен, как оригинал? И всё равно эффективно!
Вы можете использовать другой шрифт, возможно, сделать график меньшего размера или, может быть, повернуть месяц-год в другую сторону. Нет проблем. Я уверен, что если вы примените первые три фильтра, то что бы вы ни создали, преодолеете «последний километр» лучше.
Вот пример того, как сделать прямо противоположное принципу №1. Ось Y искусственно установлена на 100%, в результате тренд занижен.
Вам не нужно заходить так далеко.
Просто позвольте своему любимому инструменту для построения графиков автоматически установить основную и второстепенную оси, в результате график будет выглядеть так…
Просто. Без фокусов.
Тренд стоит сам по себе, ожидая ваших слов о том, почему он имеет значение.
Следующий пример довольно интересен. Моя просьба к вам — не прокручивать дальше слайда. Пауза. Впитайте график. Постарайтесь понять, что на самом деле пытается сказать автор.
Для бонусных баллов рассмотрите перспективу человека, читающего этот график, а не человека, который его создал.
Читайте. Не прокручивайте. Впитывайте.
Насколько хорошо вы поняли тенденцию и идею, которую пытаются донести? Что бы вы сделали иначе, если бы создавали график?
Вот некоторые вещи, которые мне бросились в глаза:
4. Показывайте столько данных, сколько требуется, и не более того.
Цель в оригинале, кажется, состоит в том, чтобы показать главные приоритеты за 12 месяцев. Если это так, то данные за август 2017 года действительно добавляют ценность?
Часто мы хотим показать все данные, которые у нас есть (в конце концов, мы потратили время на их сбор!). В этом случае это мешает пониманию сдвига за 12 месяцев.
5. Экспериментируйте с вариантами визуализации, даже в Excel!
У нас есть пять измерений данных и по две точки данных в каждом (если применить принцип №4). Мы хотим, чтобы аудитория могла сравнить две точки данных по каждому измерению и просмотреть все пять измерений.
Гистограмма — не самый оптимальный способ позволить аудитории это увидеть. Подумайте об экспериментах с различными визуализациями в Excel (или D3js).
Я применил радарную диаграмму к этим данным и получил такой прекрасный результат…
В десять миллионов раз проще увидеть две точки данных по пяти измерениям и понять, что только два из них изменились.
Аналогично общий тренд также становится намного очевиднее в этом случае.
Мы могли бы потратить десять минут, чтобы объяснить данные и тренд в оригинале. Теперь мы можем сделать это за пять секунд. Вы можете использовать оставшееся время, чтобы обсудить, почему эта тенденция имеет значение и что с этим делать (если что-то нужно). Фактически позволяя данным играть свою естественную роль: влиять на решения.
Это действительно хороший пример урока, о котором мы склонны забывать всё время (включая меня).
Вы знаете упражнение, о котором я говорю. Пауза, размышление над этим слайдом, затем прокрутка.
Вот что бросилось мне в глаза:
6. Не отправляйте графику делать работу таблицы.
В этом случае мы сравниваем две простые точки данных по двум измерениям (прошлое, настоящее). Зачем нам нужен график, занимающий всё пространство?
Почему бы просто не иметь таблицу, которая показывает предыдущие 12 месяцев как 7,1%, а под ней строку со следующими 12 месяцами как 8,9%?
Ещё лучше, почему бы не иметь одну строку текста:
Процентное изменение маркетинговых бюджетов = +1,8 ПП
Зачем нужны две толстые полосы?
Как только вы придёте к такому выводу, вы примените принцип №4 и поймёте, что самые интересные данные на этом слайде — это не визуал… Скорее, это таблица в правом верхнем углу слайда.
Бада, бин, бада, бум, через десять секунд вот ваш слайд:
Простая таблица с небольшим добавлением цветов, которая выделяет основное сообщение просто, прямо и быстро.
Более светлый оттенок для основных чисел приведёт к тому, что они будут немного отодвинуты на задний план. Этот простой выбор мягко направляет взгляд читателя на дельту (самое важное).
Мне нравится немного поиграть с границами, как вы видите выше. У вас могут быть другие вещи, к которым вы придирчивы. И это нормально. :)
Чтобы проиллюстрировать принцип №6, вот ещё один слайд, где графика совершенно не нужна:
Небольшая таблица с двумя точками данных подойдёт просто отлично.
Вот бонусный урок для аналитиков-ниндзя. Пожалуйста, не намекайте на линейную тенденцию между «текущими уровнями» и «следующими тремя годами». Нет никаких указаний на то, что данные за 2017–2020 годы доступны, и маловероятно, что они будут следовать линейной тенденции. Это ещё один пример нарушения принципа №1.
(Давайте не упускать из виду общую картину: я в восторге от того, что расходы на аналитику так сильно увеличатся! Когда наши лидеры потратят эти деньги, я надеюсь, что они вспомнят правило 10/90, чтобы обеспечить оптимальную отдачу. Деньги должны идти к вам!)
Это действительно поставило меня в тупик.
Давайте посмотрим, сможете ли вы усвоить то, что происходит. Внимательно, серьёзно посмотрите на график и посмотрите, поймёте ли вы суть…
Жирные элементы естественным образом привлекают взгляд, в данном случае синие полосы. Большинство людей в западном мире смотрят слева направо, именно так вы, скорее всего, попытаетесь понять, что происходит.
Ваше первое впечатление, скорее всего, будет заключаться в том, что синие полосы показывают случайную тенденцию расходов на маркетинг.
Если вы любопытный человек, вы поймёте, что это неправильный вывод, и захотите понять, что происходит на самом деле. Вскоре вы доберётесь до оси X и внимательно изучите её, и выяснится, что причина странности — это выбор показать названия отраслей в алфавитном порядке!
7. Пожалуйста, пожалуйста, пожалуйста, помните об интересах конечного пользователя.
В этом случае конечные пользователи (наши руководители высшего звена) в первую очередь были бы заинтересованы в том, чтобы понять, где расходы на маркетинг самые высокие и самые низкие. Это очень трудно осуществить выше.
Во-вторых, они захотят знать, где они находятся в контексте всех других отраслей, это почти невозможно осуществить выше.
Причина, по которой ось X организована в алфавитном порядке, заключается в том, чтобы вы могли легко найти свою конкретную отрасль. Эта мысль хороша. Моя гипотеза заключается в том, что она, вероятно, составляет небольшой процент случаев использования, в первую очередь потому, что просто знать свои расходы не так уж и ценно. Ценно то, что стоит за двумя более крупными вариантами использования.
Вот что я рекомендую держать в голове: если неаналитик смотрит на данные, какие варианты использования формируют основу ценности, которую они извлекут. Тогда убедитесь, что инфовизуализация решает эту задачу.
В этом случае полосы с данными, похоже, расположены в случайном порядке. Визуализация мешает, создавая более широкий «последний километр».
К счастью, это можно быстро исправить в старом добром Excel. Через две минуты у вас будет небольшой водопад…
Легко увидеть выбросы и группу из восьми человек, которые находятся близко друг к другу (то, что вы не можете увидеть на оригинале).
Конечно, потребуется пара дополнительных секунд, чтобы найти свою отрасль, но во имя двух более крупных вариантов использования это небольшая цена.
Я ненавижу круговые диаграммы. Я действительно это делаю.
Вы можете прочитать 506-страничное любовное письмо о моей глубокой неприязни (включая прекрасное упражнение, которое вы можете выполнить).
Вот научная причина:
Сравнение по углу значительно сложнее, чем по длине.
Это хорошо видно ниже…
Цвета в диаграмме привлекут ваш взгляд. Однако по размерам кусочков трудно усвоить различия между каждым измерением.
8. Ешьте пироги, не делитесь ими!
Поскольку люди находят сравнение длин намного проще, должно потребоваться всего несколько минут, чтобы взять данные и преобразовать слайд выше в нечто, что эффективно преодолеет «последний километр».
Вышеупомянутый слайд — хороший пример того, как применить все принципы, которые вы изучили до сих пор. Вопрос и данные — герои, почти все сами по себе. Что позволяет вам сосредоточиться на своей истории.
Прокрутите вверх и вниз и сравните два слайда. Вы увидите гораздо больше различий.
Я превозносил добродетель использования таблицы вместо того, чтобы быть особенно сексуальным и вставлять график.
Проблема с таблицами заключается в том, что они могут очень быстро стать перегруженными.
Вот пример, который ясно это иллюстрирует…
Чувствуется, что данных много. Это также нарушает принцип №2, ложная точность, что только усугубляет ситуацию.
Учитывая основное сообщение, которое пытается передать анализ, я считаю, что он также нарушает правило №4, лишнее, возможно, ненужные данные.
9. Сделайте так, чтобы ваши таблицы выделялись, направляйте взгляд читателя.
У вас есть множество инструментов в Excel, чтобы ваши таблицы выделялись. Я обычно начинаю с игры с опциями, которые есть в моём распоряжении в разделе «Условное форматирование».
Один из простых вариантов — использовать цветовые шкалы, от зелёного к жёлтому, чтобы получить более простую таблицу…
Устранение общего среднего делает таблицу более компактной.
Легче посмотреть на тренд в каждом столбце. Что ещё более восхитительно, так это второй вариант использования для сравнения максимумов и минимумов по четырём измерениям. Намного проще.
Хотя все данные по-прежнему там, большинство руководителей высшего звена хотят понять тенденции и контрасты. Они хотят относительного позиционирования, вышеприведённая таблица не требует затрат слишком многих мозговых клеток, чтобы это понять. И если ваш начальник вам не доверяет… У неё всё ещё есть цифры.
Обратите внимание на сочетание шрифтов, цветов, стилей в таблице выше. Множество тонких моментов.
Если ваши личные вкусы отличаются, ничего страшного. Есть и другие стили, которые вы можете использовать.
Вот данные, визуализированные с использованием сплошных заливок Data Bars…
В этом случае я чувствую, что столбцы данных добавляют беспорядок, но облегчают понимание тренда по отдельным измерениям.
Если, как и я, вы склонны к радикальной простоте посредством белого пространства, вы можете оставить таблицу. Рассмотрите возможность применения некоторого тонкого цветового оформления для создания чего-то, что всё ещё является шагом вперёд по сравнению с оригиналом…
Я показал максимумы и минимумы таким образом, чтобы вы могли быстро их увидеть.
Красный был выбран специально, чтобы подчеркнуть, что это самое важное с точки зрения клиента. Синий немного уходит на задний план, потому что он наименее важен.
Последний штрих.
Я посчитал, что может быть полезно увидеть измерения продуктов и услуг вместе, сравнивая их по B2B и B2C.
Вот эта версия…
Есть небольшая воздушная щель в таблице, чтобы подчеркнуть, что два сравнения различны. Вы обычно можете использовать такие визуальные подсказки, чтобы помочь потребителям вашего анализа.
Мы не согласны по множеству вопросов в нашей стране в эти дни, но есть одна вещь, с которой мы все можем согласиться: продолжительность концентрации внимания человека, вероятно, составляет десять микросекунд.
Вдобавок к этому короткому промежутку внимания тот факт, что у каждого руководителя есть 18 других срочных дел, занимающих его мозговые клетки. Как будто всего этого было недостаточно, пока вы представляете, они также, скорее всего, будут в телефоне или ноутбуке.
Убедить кого-либо в таких обстоятельствах — задача геркулесова.
Учитывая этот контекст, как вы думаете, сколько лидеров поймут, что здесь происходит…
4 измерения х 5 временных периодов х сумасшедшие колебания = Ой!
Для бонусных баллов обратите внимание на случайность на оси X. Она прыгает с 2014 на 2017 без какого-либо видимого объяснения. Чтобы ещё больше запутать ситуацию, посмотрите на линии тренда — они соединяют две точки данных, чтобы подразумевать тенденцию между 2015 и 2016 годами, которая может существовать, а может и нет.
Для ещё большего количества бонусных баллов обратите внимание, что есть четыре февраля и, как будто в этом нет ничего страшного, август добавлен случайным образом.
Ой. Ой.
Это могут показаться мелкими проблемами, но я уверяю вас, что вы мгновенно потеряете доверие любого умного руководителя в комнате. Они не поднимут руку и не начнут ругать вас. Они тихо сделают мысленную заметку о вас, а затем не будут обращать внимания ни на что, что вы говорите.
Есть ещё более важный принцип, который нужно усвоить из этого визуального…
10. Пусть высший бит будет вашей путеводной звездой.
Может быть трудно понять, как перейти от сложного к простому. Моя рекомендация — начать с самого важного, что вы пытаетесь сказать.
В этом случае цель состоит в том, чтобы осветить процентное изменение маркетинговых знаний в ближайшие 12 месяцев. Итак, нужны ли остальные точки данных и имеют ли они ценность?
Ради высшего бита я бы сказал, что мы также можем избавиться от двух февралей и одинокого августа. (Хотя я искренне уважаю усилия, затраченные на получение этих точек данных.)
С учётом этих решений у нас осталось всего две точки данных. Мы можем перейти к простой таблице и преодолеть «последний километр», создав этот слайд…
Проще, правда?
Мы можем сделать ещё лучше.
Если цель состоит в том, чтобы просто показать изменение, мы можем просто показать процентное изменение.
Цвета помогают ещё больше сосредоточить внимание.
Чтобы увидеть драматические изменения, прокрутите вверх и посмотрите на оригинал, а затем вернитесь сюда. Невероятно, правда?
Может показаться, что это тяжёлая работа, требующая времени. Это действительно занимает больше времени. Но это не в чернилах, а в мышлении. Обсуждение, дебаты, действительно продумать то, что мы пытаемся донести. Визуализация занимает гораздо меньше времени.
Самая большая проблема с этим типом анализа, скомпилированного в 95 слайдах, заключается в том, что он никогда не отвечает на вопрос почему?
Посмотрите на этот слайд в качестве примера. Он демонстрирует очень позитивный взгляд на аналитику…
Слайд нарушает все десять принципов, которые мы обсудили в этом посте, но помимо этого есть более серьёзная проблема.
11. Почему. Ваша работа — отвечать на вопрос почему!
Ваш первый инстинкт — восхититься сдвигом (все синие цвета выросли!), и поразмышлять о том, как этот график обеспечит долгосрочную безопасность работы каждому, кто читает этот блог. Но вы аналитик, и это хорошее чувство не продлится долго.
Ваш разум быстро переходит к… почему? Что вызывает этот сдвиг?
Посмотрите на Mining/Construction, 60 процентных пунктов изменения. ОМГ! Почему?
Создатель этого отчёта, к сожалению, нигде не отвечает ни на один вопрос почему. Возможно, намеренно.
Но подумайте вот о чём: данные вызывают любопытство. Если аналитик не утолит это любопытство посредством более глубокого анализа, объясняющего почему, те же данные превращаются в разочарование. Они, конечно, не приводят к изменениям.
Я писал об этой теме раньше, используя пример из Econsultancy и Lynchpin: «Умные результаты опросов и влияние: отказаться от модели Asker-Puker!»
Без почему ваш «последний километр» будет шириной в миллион миль. Если вы собираетесь заниматься ретрансляцией данных, пожалуйста, считайте своей работой отвечать на вопрос почему. Без этого все это… фейковые новости.
Вызов для вас.
Теперь, когда вы знаете о 11 принципах, которые помогают преодолеть «последний километр», я хочу, чтобы вы решили одну задачу от моего имени.
Я понятия не имел, что делать с этим слайдом… Можете ли вы создать альтернативную версию?
Отчасти проблема в том, что я не мог по-настоящему усвоить то, что было сказано. Отчасти дело в том, что цифры на самом деле не сильно меняются. Отчасти это потому, что я был разрываем между графикой и таблицей в правом верхнем углу.
В любом случае я сдался. Возможно, вы сможете научить меня и наших читателей, как будет выглядеть версия с уменьшенным «последним километром».
Просто напишите мне свою версию (блог на kaushik dot net) или прокомментируйте ниже.
Вот краткое изложение 11 принципов, которые вы можете использовать, чтобы преодолеть «последний километр»:
- Выбор графиков может преувеличивать или недооценивать реальность.
- Ложная точность может привести к беспорядку и подорвать гениальность аналитика.
- Удалите отвлекающие факторы, безжалостно.
- Показывайте столько данных, сколько требуется, и не более того.
- Экспериментируйте с вариантами визуализации, даже в Excel!
- Не отправляйте графику делать работу таблицы.
- Пожалуйста, пожалуйста, пожалуйста, помните об интересах конечного пользователя.
- Ешьте пироги, не делитесь ими!
- Сделайте так, чтобы ваши таблицы выделялись, направляйте взгляд читателя.
- Пусть высший бит будет вашей путеводной звездой.
- Почему. Ваша работа — отвечать на вопрос почему!
Я желаю вам меньших пробелов и больше решений, основанных на данных.
Теперь ваша очередь.
Как широк «последний километр» в вашей практике? Что, по вашему мнению, больше всего способствует возникновению этого пробела? Какой из вышеперечисленных принципов вы использовали с хорошим эффектом? Есть ли у вас любимый принцип или пять, чтобы преодолеть разрыв? Если бы вам пришлось убить одну практику, когда дело доходит до представления данных, кто бы стал избранным кандидатом?
Пожалуйста, поделитесь версиями вышеприведённых примеров, над исправлением которых вы поработали. И ваши уроки, лучшие практики и, как всегда, ваша критика через комментарии ниже.
Спасибо.
