Аналитика промо-кампаний
DSP: различия и преимущества lookalike и предиктивных моделей. Часть #2
DSP-платформа это про данные и работу с ними. Чем больше качественных данных, тем эффективнее работает платформа.
Это вторая часть экспертного материала Rocket10, в котором коллеги подробно и аргументированно рассказывают о том, как начать продвижение через DSP, а также объясняют что и зачем требуется со стороны рекламодателя для оперативного старта рекламных кампаний и эффективного продвижения. И в этой статье ребята говорят о lookalike и предиктивных моделях, объясняют, чем они различаются, а также максимально детально рассказывают о том, как проходит обучение мобильной платформы.
О ценности неатрибуцированных данных для DSP читайте в первой части материала.
Что такое lookalike модели и зачем они нужны?
Look-alike модели строятся на основе данных о поведении и интересах существующих пользователей приложения, таких как установки, покупки и так далее. Алгоритмы ML и AI анализируют эту информацию и выявляют общие черты и паттерны поведения, которые могут быть использованы для поиска новой аудитории, необходимой рекламодателю и имеющей максимально схожие с текущей аудиторией интересы и поведение.
То есть lookalike модель – это инструмент, который:
- берёт некоторую аудиторию, которую рекламодатель называет целевой;
- анализирует всю заданную аудиторию (например, все аукционы по гео Россия или Италия, в которых участвовала мобильная платформа) на факт “похожести” на целевую;
- в зависимости от степени близости поступающих новых реквестов к целевой аудитории, lookalike модель применяет к базовой ставке коэффициент (чем более “целевой” реквест, тем выше на него будет ставка).
Look-alike модели нужны, чтобы со старта рекламной кампании отсеять (ставить ставку ниже) реквесты на показ рекламы, которые не попадают близко к целевой аудитории; либо, наоборот, выкупать дороже аудиторию, которая близка к целевой. Ставка (bid) – это определяющий параметр аукциона, на котором покупается показ рекламы. Очевидно, что чем выше ставка, тем больше шанс выиграть аукцион и показать рекламу, так вот – lookalike модели нужны для того, чтобы чаще показывать рекламу целевой аудитории, а менее целевая аудитория будет либо игнорироваться (ставка =0), либо выкупаться с существенным дисконтом.
Что такое предиктивные модели и зачем они нужны?
Теперь вполне логично переходим к предиктивным моделям.
Предиктивная модель – это продукт нейросети, обученной на данных, которые мобильная платформа получила непосредственно со своих рекламных кампаний, другими словами, это атрибуцированные платформе данные. Результатом работы нейросети является набор “правил” (фич), согласно которым система определяет ставку для каждого конкретного приходящего реквеста на показ рекламы, которую необходимо поставить в аукционе, чтобы получить необходимый результат (таргет CPI/CPA/ROAS).
Нейросеть рассматривает массив атрибуцированных данных и определяет ставки исходя из тех результатов, которые в нее загружены для обучения.
Вот упрощенный пример. На основании эксперимента (периода обучения) нейросеть выяснила следующее:
- Синие шарики продаются в среднем по $4, внутри двух из десяти синих шариков находится конфета;
- Красные шарики продаются в среднем по $5, в пяти из десяти красных шариков находится конфета;
- Черные шарики продаются в среднем по $10, конфет в них нет.
Соответственно, чтобы в среднем получить конфету, нужно купить 5 синих шариков (это в среднем стоит $20), либо 2 красных шарика (это в среднем стоит $10). А черные шарики покупать не нужно, там конфет нет.
Далее задаем нашей предиктивной модели таргет: хочу покупать конфеты по $10. И получаем, что синие шарики она будет пытаться купить по $2 (потому что в среднем надо купить 5 шариков, чтобы получить конфету), красные по $5 (потому что в среднем надо купить 2 шарика, чтобы получить конфету), черные вообще покупать не будет. Если задать таргет: хочу покупать конфеты по $20, то красные шарики будут куплены по $10, а синие шарики по $4.
Основное отличие предиктивной модели от lookalike модели заключается в том, что lookalike модель не знает цен (на самом деле не только цен). Она может только проинформировать о том, что черные шарики покупать не нужно, а синие нужно покупать в 2,5 раза дешевле, чем красные.
В этом упрощенном примере только одно правило (фича) – цвет. А в нейросети мобильной платформы этих правил (фич) много десятков, по ним модель и делит весь рынок по вероятностям конверсий, и на основании данных о ценах и вероятностях конверсий делает ставки.
Что такое тестовый период и как он выглядит?
Тестовый период – это период обучения предиктивной модели. Предиктивная модель отличается от lookalike модели тем, что она обучается на атрибуцированных данных. Другими словами, у платформы есть весь порядок действий, который приводит или не приводит к необходимому результату: реквест на показ рекламы пользователю, бид (ставка), победа или поражение в аукционе, показ или непоказ рекламы, конверсия или её отсутствие, и так далее.
То есть предиктивная модель имеет доступ к более широким и полным данным по конкретному целевому действию, чем lookalike модель, и, соответственно, делает более точное предсказание о совершении установки или другого целевого действия (точность зависит от объема атрибуцированных данных). В обучении точной предиктивной модели роль играют так “хорошие”, так и условно “плохие” (например, был показ рекламы, который не привёл к установке) атрибуцированные данные. Обычно платформе требуется получить около 1000 целевых ивентов (это количество может варьироваться в зависимости от рекламодателя и его вертикали), чтобы обучить предиктивную модель (её первые итерации, так как в дальнейшем ходе рекламной компании она постоянно дообучается и совершенствуется).
Для набора этих данных на этапе обучения берется одна или несколько lookalike моделей и в обязательном порядке одна широкая рекламная кампания на небольшую часть бюджета. Широкая кампания необходима для набора данных, которые будут лишены какого-либо таргетинга.
Если для построения lookalike модели не хватает данных, допустим, рекламодатель по какой-то причине их не предоставил, либо рекламодателя интересует трафик без идентификатора пользователя (характерно для iOS), нужно прибегать к другим, не столь эффективным, методам набора данных:
- использовать кампании с ручными таргетингами, которые подбираются логически;
- на основании ручного анализа неатрибуцированных данных формировать вайтлисты похожих по описанию или названию приложений;
- делить рынок по разным срезам, пробовать разные срезы с разными ставками и тому подобное.
Как правило обучение предиктивной модели такими инструментами требует бОльших финансовых вливаний на этом этапе. В целом, чем более широкие и разнообразные данные получает платформа на этапе обучения, тем лучше и точнее итоговые результаты. Все эти методы помогают рекламодателю оптимизировать маркетинговый бюджет на тестовом периоде.
Заключение
Как вы скорее всего уже поняли, DSP-платформа это про данные и работу с ними. Чем больше качественных данных, тем эффективнее работает платформа.
В заключение немного перефразируем цитату Натана Ротшильда. Кто владеет информацией и делится ею с DSP – тот:
- Эффективно продвигает свои продукты в приложениях;
- Получает максимум возможностей от своего маркетингового бюджета;
- Обогащает знания о своей целевой аудитории и понимает как масштабироваться;
Надеемся, что эти экспертные материалы помогут рекламодателям лучше разбираться в работе DSP и быстрее достигать запланированных результатов! А если у вас всё же остались вопросы, то напишите на hello@rocket10.com и коллеги с удовольствием ответят на них.