Портрет покупателя: LifeStyle Segmentation по журналу продаж
LOYALTY.INFO 5(31) сентябрь-октябрь 2009г.
Сегментация покупателей – одно из наиболее важных решений любого предприятия, но принимаемое по наиболее неполной информации. И это при том, что у торговых сетей информации о покупателях для этих целей более чем достаточно. Как информация о покупках помогает рисовать портреты, мы решили спросить у Максима Дробышева, автора технологии LifeStyle Segmentation.
С Максимом Дробышевым, директором LifeStyle Marketing, беседовала Надежда Хулапова
L.I. Расскажите об основных сложностях, с чем сегодня сталкиваются маркетологи, приступая к сегментации покупателей?
– Обычно, цель сегментации – определить, в каких упаковках, с какими предложениями и через какие каналы продвигать продукцию, в том числе – с помощью рекламы. Для этого нужно определить, по каким каналам доступны разные категории покупателей, какие их потребности может удовлетворить продукт и какие аргументы для них будут убедительными. Дело это непростое и очень затратное.
Маркетинговые исследования помогают решать эту задачу, но они имеют дело с мнениями покупателей, их ответами на вопросы о том, стали бы они покупать тот или иной товар или услугу или нет, и почему. Но на принятие реального решения влияет много факторов, о которых многие покупатели и не догадываются. Плюс ко всему, они склонны неправильно оценивать собственное поведение, поэтому мнения о будущих покупках очень часто оказываются обманчивыми. Даже когда анализируется текущее потребление, люди редко могут объяснить реальные причины покупок – слишком много решений принимается спонтанно (подсознательно). Поэтому основная сложность – отсутствие надежных данных как о потребностях, так и о каналах и убедительных аргументах.
В то же время в торговле накапливаются огромные объемы информации о фактическом потреблении, по сути – привычках покупателей, которые можно использовать для продвижения товаров. Кроме того, с введением программ персональной работы с покупателями появляется канал, по которому можно доносить любую информацию индивидуально до каждого покупателя и измерять отклик. Для этого нужно для каждой планируемой акции определить, чем отличаются покупатели, хорошо реагирующие на предложение, от тех, кто реагирует слабо. И в дальнейшем адресовать каждое предложение только тем, у кого есть в нем потребность. Тут возникает другая сложность – до последнего времени не было подходящих инструментов для такого анализа.
L.I. Почему компании так неохотно рассказывают о своем опыте в этой области?
– Мне кажется, причина в том, что сегментация покупателей для производителя – одна из самых интимных частей бизнеса, самая что ни на есть коммерческая тайна. А розница до сих пор не считала сегментацию покупателей по товарам своей задачей, хотя как раз у них накапливаются все самые интересные данные. Плюс не было инструментов, которые могли бы обрабатывать гигабайты информации без предварительной «чистки» данных.
L.I. Каковы самые распространенные подходы к анализу покупок?
– До последнего времени для анализа покупательского поведения чаще всего использовались методы, предназначенные для анализа табличных данных – числовых последовательностей, данных опросов – нейронные сети, регрессии, позднее – деревья решений. Сама табличная форма представления данных при этом усложняет задачу, поскольку требуется преобразовать всю историю покупок в небольшое количество колонок в таблице так, чтобы в ячейках не было пропусков, а колонки были независимы друг от друга. Представьте базу данных, скажем, гипермаркета. Десятки и сотни тысяч наименований и столько же, если не больше, опечаток, дубликатов, терабайты транзакций. Привести эти данные по каждой планируемой акции к нормализованному виду – это огромная работа, больше напоминающая сизифов труд. Плюс представление результатов многих алгоритмов, например, карт Кохонена или нейронных сетей, не всегда понятно даже людям со специальной математической подготовкой.
Другой метод анализа покупок – алгоритм «ассоциативных правил», то есть выявления часто присутствующих товаров в корзине. Но он не учитывает стоимость и время покупок, дополнительные данные о покупателе, не распознает дубликаты товаров, и не позволяет прогнозировать финансовый результат акций, что повышает риск уйти в минус при их проведении.
Еще более простой метод используется в интернет-магазинах и рекомендательных сервисах, когда сегментация не проводится, а для каждого потенциального покупателя находятся похожие покупатели, и делается предложение из ассортимента, который они покупали. В этом случае делается предположение: каждый человек – цельная личность, поэтому, если выбор одного совпал с выбором другого, то они будут похожи и при выборе других товаров. Очевидно, что это далеко не всегда так. Скорее, у покупателей могут быть общие привычки, может быть похожа какая-то часть образа жизни.
L.I. Но, насколько нам известно, Вы предлагаете альтернативное решение?
– Да, мы тоже в процессе выполнения договоров консалтинга с несколькими клиентами столкнулись с проблемой отсутствия адекватного инструмента для анализа стилей потребления. И, поскольку в нашем холдинге основное направление – разработка программного обеспечения для программ работы с покупателями в торговых организациях, восприняли это как вызов и придумали алгоритм, который позволяет анализировать данные в том виде, в каком они есть, и получать такие результаты, которые требовались в разработанных нами сценариях.
LifeStyle Segmentation позволяет выявлять скрытые закономерности в истории любых операций среди миллионов параметров |
Основное отличие в том, что характеристики покупателей обрабатываются не в виде таблицы, а в виде базы данных, что позволяет обрабатывать миллионы показателей. Поэтому появляется возможность анализировать все возможные характеристики покупателя по всем транзакциям, анкетам, журналам веб-сайтов и другим данным, а алгоритм самостоятельно выявит из них самые значимые для практического применения и построит портрет в виде дерева решений.
То есть работа может быть построена в таком порядке:
1. Указываем источники данных, чаще всего – в виде текстовых файлов
2. Определяем продвигаемые товары
3. Если акция только планируется, вводим параметры моделирования результатов (стоимость пробника, доля покупателей, которая их возьмет и т.д.)
4. Запускаем процессы моделирования поведения и сегментации, которые находят наиболее характерные черты лучших покупателей, а также других покупателей с такими чертами.
5. Используем полученный файл с похожими покупателями для проведения акции, или загружаем полученное дерево решений для каждой акции в процессинговую систему.
L.I. Как это работает?
– Покупки – это отражение привычек и образа жизни каждого потребителя. Например, покупка товаров со словами «Китти», «Лыж», «Барбекю», «Подгузники», «Тетради», «Штопор» и т.д. позволяет достаточно точно выявить потребности человека и предложить нужные данному покупателю дополнительные товары/услуги. Поэтому каждую покупку мы разбиваем на встречающиеся слова в названии товара, и с учетом суммы покупки, времени суток, дня недели, а также других факторов сезонности (например, количества дней до дня рождения покупателя), формируем все возможные показатели поведения покупателя.
Посмотрите на экране (рис.1, прим.ред.): тут отображен анализ поведения покупателя для акции продвижения товара «Батон Солнечный» на небольшой базе данных, которую можно скачать с нашего сайта.
Слева внизу расположены все его покупки, а справа – характеристики его поведения, вычисленные на их основе: «Сумма покупок со словом Торт», «Количество покупок со словом «Шоколадный» по пятницам» и т.д. На каждого покупателя приходятся десятки тысяч таких характеристик, а на всех покупателей – миллионы. Тем не менее, алгоритм обрабатывает их за вполне разумное время. Например, в другом проекте данные о 20 миллионах операций 500 000 покупателей были обработаны на обычном ноутбуке за ночь. Именно среди этих миллионов признаков алгоритм найдет те «10 отличий», характерных для покупателей продвигаемых товаров.
Вторая необходимая часть информации для продвижения товара – прибыльность контакта с данным покупателем в определенный момент. Если уже есть результаты акции, то прибыльность контакта известна, и нужно только определить, чем отличаются покупатели с хорошим результатом акции от тех, кому лучше было предложение не отправлять. Если же акцию еще не проводили, то можно оттолкнуться от тех данных, которые есть, используя предположение: если сделать предложение новому покупателю, такому же, как и уже существующий (то есть уже покупающий целевой товар), то с определенной долей вероятности у него тоже есть потребность в этом товаре.
Этих двух типов данных: характеристик покупателя и оценки прибыльности акции достаточно, чтобы алгоритм LifeStyle Segmentation нашел, по каким критериям лучше сегментировать покупателей, чтобы получить наибольший финансовый результат от каждой акции.
L.I. Хорошо, давайте попробуем повысить продажи этого товара. Как я понимаю, мы хотим раздать часть партии бесплатно, на пробу. Как выделить покупателей, которые будут потом регулярно покупать батон? И отсечь покупателей, которые возьмут подарок «просто так», только потому что раздают бесплатно?
– Абсолютно верно, задача – выделить потенциально прибыльных покупателей для акции. В первую очередь, все поведение покупателей делим на целевое (покупки продвигаемого товара, то есть в данном случае батона «Солнечный») и нецелевое (все остальные данные). Таким образом, мы получаем две группы: наши постоянные потребители батона и покупатели, которые его у нас никогда не приобретали. Задача найти во второй группе потенциальных потребителей батона, которым стоит предложить его попробовать, поскольку они с большой вероятностью после этого будут его покупать в будущем. Эту задачу и помогает нам решить алгоритм сегментации.
Поскольку акция только планируется, то вместо того, чтобы взять фактические результаты, нужно смоделировать ее возможную результативность для каждого покупателя. Для этого предполагаем, что, если появится потенциальный покупатель, во всем кроме целевого поведения такой же, как и уже существующий покупатель, то с определенной вероятностью его объем потребления товара будет таким же.
На рисунке 1 показан расчет покупателя № 5: он дважды за месяц покупал батон «Солнечный» на общую сумму 19 рублей 56 копеек. Предполагаем, что из таких же покупателей, как он, примут участие в акции и возьмут батон 40%. Из них 40% будут делать повторные покупки. Эти значения можно будет уточнить после пробного запуска акции. В доходы от акции мы относим маржу 30%, которую предположительно получим от повторных покупок за средний период «жизни покупателя» (полгода). Итого в расчете на один контакт мы заработаем 5,45 руб. В расходы записываем стоимость одного контакта (печати купона, отправки SMS) и ожидаемые расходы на пробный товар с учетом доли покупателей, которые его возьмут, всего 2,9 руб., то есть прибыль на один контакт составит 2,55 руб. Подобным образом, для каждого потенциального покупателя будет построен прогноз прибыльности. Раздача пробников, флаеров, приглашений – это одна из возможных акций, так называемый BTL. Но и адресная реклама, и предоставление персональных скидок покупателям также может моделироваться с помощью шести параметров формы в разделах «Доходы» и «Расходы», просто в этом случае некоторые параметры не заполняются или в случае вероятности равны 100%. По опыту приведенная форма подходит для решения большинства задач. Кроме того, при наличии фактических результатов проведения акции, моделирование результата не требуется, можно брать реальные значения прибыли на покупателя.
Итак, у нас есть портрет целевого участника акции. Теперь алгоритм должен определить, какие из вычисленных показателей поведения наиболее важны (см рис 2).
На первом же уровне получаем прибыльный сегмент R1 – покупатели товаров со словом «Ф/П» в сумме более 69 рублей в месяц. Сопоставляем полученные данные с поведением покупателя на рисунке 1, и видим, что «Ф/П» употребляется в молочных продуктах и означает «фин.пакет» – мягкая полиэтиленовая упаковка эконом-класса. То есть покупатели, которые выбирают недорогое молоко – и есть целевая аудитория для батона «Солнечный».
Отмечу, что эффективность алгоритма не зависит от нашей интерпретации поведения покупателя – для экономического эффекта достаточно того, что есть статистически достоверная закономерность, которой можно пользоваться для выделения целевой аудитории.
Всего целевых покупателей 200 человек, среди них средний доход на один контакт 51 копейка. Если же расширить целевую аудиторию акции до всех покупателей, то мы получим отрицательный доход – убыток с каждого контакта составит 1 рубль 40 копеек. То есть если бы мы проводили обычную BTL-акцию, раздавая талоны на хлеб, получили бы убытки. Адресное же сужение аудитории в три раза позволит нам провести прибыльную акцию, расширить корзину потребления части покупателей и еще одной ниточкой привязать их к магазину.
<L.I. Как Вы оцениваете перспективы адресных акций в торговле?
– С точки зрения производителя или продавца, сегментация покупателей при проведении акций может сделать убыточную BTL или рекламную акцию прибыльной, адресные предложения покупателям в разы уменьшают затраты на рассылку и повышают отклик.
С точки зрения покупателя, сегментация позволяет отсеять рекламные предложения, заведомо ему не интересные, и, наоборот, воспользоваться положительным опытом других покупателей с похожими потребностями, которым понравился тот или иной товар.
Если в качестве товаров для продвижения использовать «товары – драйверы», то есть те, ради которых покупатели приходят в магазин, то можно заранее сформировать «запасные» товары – драйверы для покупателей. Когда пройдет время, и первый товар, привязавший покупателя к Вашему магазину, потеряет для него актуальность, Вы уже будете во всеоружии: будет не один, а сразу несколько товаров, ради которых покупатель будет к Вам приходить. Но даже если не учитывать этот результат, каждую адресную акцию можно сделать прибыльной. И я уверен, что именно за ними будущее торговли. Адресные предложения уже стали частью электронной коммерции и думаю, что они скоро прочно укоренятся в традиционном ретейле.
L.I Какие еще интересные портреты покупателей встречались при работе с данными?
– Другой пример – определение портретов зрителей фильмов для сервиса видеопроката на основании оценок, поставленных ими на веб-сайте по шкале от 1 до 5. В данном случае целевой показатель не деньги, поэтому анализируются не покупки, а оценки зрителей. За пороговую оценку, выше которой рекомендация удачна, взято 4 балла, поэтому результат акции – реальная оценка минус 4. Поскольку оценка уже произошла, модель упрощается, и все вероятности в этом случае равны 100%.
Например, как видим на рисунке 3, зрители, высоко оценившие фильм «Красотка» – это те зрители, которым нравятся «Грязные танцы» и «Стильная штучка» (английской название Sweet Home Alabama), среди них средняя оценка «Красотки» – 4,5, в то время как среди остальных – около 3,45.
Другие примеры фильмов: Для любителей фильма «Форрест Гамп» самый значимый показатель – привычка смотреть фильмы «Special Edition» (обычно режиссерские варианты с дополнительными материалами). Попробуйте угадать, каков основной признак зрителей, которым понравился фильм «Шрек-2»? Подумали? Конечно же, самый надежный признак – оценка фильма «Шрек»! А среди тех, кто его не смотрел – положительные оценки фильмов «Брюс Всемогущий», «Сказка про акулу», а также отсутствие или низкая оценка фильма «Молчание ягнят» и фильмов со словом «FOR» («Охота за красным октябрем», «Реквием по мечте» и т.д.).
В другом проекте мы анализировали портрет покупателей, которым есть смысл дать «Кофе Капучино» в подарок «от заведения». Выяснилось, что это те, у кого «Сумма покупок со словом «кофе»» больше 17 рублей, и при этом «Сумма покупок по утрам» больше 454 рублей, то есть покупатели, у которых есть привычка пить по утрам кофе в кафе. При этом если по всем покупателям убыток от каждого напечатанного купона составил бы 3,32 руб., то среди 3,35% целевых покупателей, удовлетворяющих условиям, средняя прибыль на один купон составит 5,88 руб.
Как видим, портреты покупателей чаще всего интуитивно понятны, но только после того, как анализ их выявил. Предугадать портрет покупателей в отношении сотен разных товаров практически невозможно, да и зачем, если теперь это может за ночь сделать ваш персональный компьютер? На сайте LifeStyleMarketing.ru можно посмотреть и другие примеры, и самостоятельно провести анализ по прилагающимся данным.