Изучение статьи Amazon.com Recommendations Item-to-Item Collaborative filtering (построение рекомендаций типа товар-товар на основе предпочтений пользователей) подтолкнуло меня сделать краткий обзор этой статьи плюс добавить свои собственные мысли. Сама статья была написана командой разработчиков рекомендаций Amazon.com.
Итак, товарные рекомендациии. Amazon.com утверждает, что 40% продаж генерируются через механизмы рекомендаций. Насколько достижима эта цифра? В принципе достижима, в Ozon.ru на сегодняшний момент треть всех добавлений в корзину делаются через рекомендации. Оборот обычно коррелирует с добавлениями в корзину, поэтому можно считать, что треть оборота прокачивается через рекомендации. Для измерения этих параметров мы используем , а именно .
Системы различных рекомендаций появились для того, чтобы облегчить покупателю выбор, т.к. выбор стал слишком большой. Например, в Ozon.ru несколько сотен тысяч товаров. Понятно, что сделать выбор очень и очень трудно. Преимущество большого выбора превращается в недостаток - необходимо много времени и усилий. Очень хороший пример здесь - интернет-магазин - очень долго приходится выбирать. Иногда даже кажется, что в обычном магазине все быстрее получится.
Преимущество электронной коммерции заключается в полноте данных, например, Ozon.ru использует для построения рекомендаций историю заказов, содержимое корзины, просмотры товаров, отзывы и рейтинги. В обычном offline магазине это сделать невозможно.
А в чем проблема?
огромные объемы данных, для обработки которых требуются большие вычислительные мощности. Например, логи посещаемости сайта, журналы заказов содержат миллионы и даже свыше сотни миллионом строк в таблицах БД.
большинство рекомендаций работают в режиме реального времени. Отклик должен быть не более половины секунды. Это не касается персональных рассылок, здесь не требуется мгновенной реакции.
очень мало информации по новым покупателям, только несколько купленных товаров или оставленных отзывов
и наоборот, у старых покупателей слишком большая история, нужно быть аккуратным, чтобы не перегрузить их информацией.
требуется быстрая перестройка рекомендаций в зависимости от последних действий (поиска на сайте, кликов и т.д.). Эту тему затрагивает в своих статьях.
Алгоритмы
В статье об Amazon.com, упоминаются три типа алгоритмов (коллаборативной фильтрации), но я добавил еще один:
примитивные статистические алгоритмы обычная коллаборативная фильтрация кластерные модели поисковые модели
но также там приводится другой алгоритм, придуманный (или где-то прочитанный ) в Amazon.com - коллаборативная фильтрация типа товар-товар.
Примитивные статистические алгоритмы
Именно с этих алгоритмов нужно начать проект рекомендаций на любом торговом сайте. Эти алгоритмы просты и надежны, не нужно иметь семь пядей во лбу, чтобы получить хорошие результаты. Да и по опяту скажу, что суммарная отдача от них будет больше, чем от персонализированных рекомендаций.
К таким алгоритмам я отношу следующие:
После просмотра этого товара купили Для такого алгоритма обычна анализируется сессии клиента, нехитрыми действиями генерируются списки сопутствующих товаров. Обычно этот алгоритм дает очень хорошие результаты, особенно, когда собрано достаточно информации.
Увеличить картинку
После этой поисковой фразы еще искали (и приводится список сопутствующих поисковых фраз) В другой реализации алгоритма можно сразу показывать товары, которые обычно покупают после данной поисковой фразы.
Увеличить картинку
После просмотра данного товара, интересовались Очень неплохой алгоритм на этапе холодного старта проекта. Бывает, что для алгоритма После просмотра этого товара купили недостаточно данных, и он здесь очень сильно пригодится.
Увеличить картинку
В следующей статье я расскажу уже про остальные три алгоритма: обычная коллаборативная фильтрация, кластерные модели, поисковые модели.
Дополнительные источники информации
1) статья, написана одним из разработчиков рекомендаций в Amazon.com 2) - тоже товарищ из amazon пишет про рекомендации. 3)
Перед запуском рекламной кампании в электронной коммерции разрабатываются маркетинговые модели, которые должны в точности отражать маркетинговую стратегию.
Интернет-реклама (или интернет-маркетинг) приводит потенциальных клиентов на сайт и требует серьезных инвестиций. Веб-аналитика помогает сделать анализ рекламы,
оценить конверсию сайта и посещаемость сайта. В качестве технического средства лучше использовать Google analytics, это очень хороший счетчик посещений сайта, можно
сказать лучший из всех бесплатных счетчиков сайтов.
На эффективность продвижения юзабилити влияет, но не настолько, как сейчас распространено мнение в сети Инернет. Больше влияют алгоритмы рекомендаций и навигация на сайте.
Сайты накапливают базу данных клиентов. И анализ интернет-магазинов показывает, что эта информация в маркетинге используется слабо.
Business intelligence или bi система позволяет делать сегментацию потребителей по поведению и демографии, а также скоринг вероятности отклика клиента.
Data mining инструменты затем используют для проведения кампаний прямого маркетинга (или direct marketing) по базе данных клиентов.
OLAP и bsc (сбалансированные показатели) инструменты очень важны для анализа в маркетинге. Bi системы также являются основой любой аналитической CRM системы.
Все это образует электронный маркетинг. Об этом весь сайт KPIs.ru, включая мои лекции по маркетингу.