Алгоритм "С этим интересуюся" на Wikimart.ru теперь на Hadoop
Просмотров: 1154 | 6 октября 2011 | Комментариев: (5)
| More

Алгоритм "С этим интересуюся" на Wikimart.ru теперь на Hadoop




Рекомендации построены на 6 нодовом кластере Apache Hadoop на виртуальных машинах.
Конфигурация каждой ноды: 2 Гб памяти, 16 ядер, 30 Гб диск.

Статистика расчетов
338 Мб - размер исходного файла со веб-статистикой
55 Гб - запись промежуточных данных
32 Мб - выходной файл рекомендаций

Затраченное время на расчет - 1 час.

Алгоритм расчета: упрощенный алгоритм item-to-item

Алгоритм "С этим интересуюся" на Wikimart.ru теперь на Hadoop


Примеры:

шина R16
к ней рекомендуются другие шины того же диаметра и автосигнализация

Протеин Magnum Nutraceuticals Quattro (2275 gr)
к модели рекомендуются другие товары из спортивного питания

Подгузники Merries 6-11 кг (M) 64 шт.

К этим подгузникам рекомендуются подгузники и товары той же фирмы, других размеров и другой версии упаковки

Плита газовая Gefest (Гефест) 700-02 двухкомфорочная
к модели рекомендуются другие двухкомфорочные газовые плиты

Если Вам понравилась эта статья, подпишитесь на RSS ленту.

| More
 (голосов: 0)



Ссылки для копирования:




#1 Автор: Леонид
Дата: 10 октября 2011 07:35
Круто! Объем проделанной аналитической работы впечатляет! А может ли такой алгоритм учитывать и надежность партнера? В цвете проскакивающих жалоб на качество сервиса и проблемы с отдельными магазинами-участниками, "рекомендовать" какого-то проблемного партнера, наверное, не имеет смысла...
Зарегистрирован: -- | ICQ: -- |
ЦИТИРОВАТЬ    

#2 Автор: Roman
Дата: 10 октября 2011 07:40
Теоретически можно, но пока рано.

Весь алгоритм работает на основе веб-статистики (и только)
Зарегистрирован: -- | ICQ: -- |
ЦИТИРОВАТЬ    

#3 Автор: picwork
Дата: 17 октября 2011 09:24
Пример с подгузниками не кажется мне верным. Зачем покупателю другой размер? Упаковку ещё могу понять, но не размер. Это как обувь другого размера рекомендовать. Покупателю нужны те же размеры, но другие производители.
Зарегистрирован: -- | ICQ: -- |
ЦИТИРОВАТЬ    

#4 Автор: Дмитрий
Дата: 21 октября 2011 11:04
С шинами - неудачный пример. Все параметры должны быть идентичны, а не только диаметр. Не дай бог кто-то купит по такой рекомендации.
Зарегистрирован: -- | ICQ: -- |
ЦИТИРОВАТЬ    

#5 Автор: Roman
Дата: 21 октября 2011 11:22
Да, контентная (характеристики товара) составляющая - это важно.
Мы планируем это включить в ближайшем будущем.
Зарегистрирован: -- | ICQ: -- |
ЦИТИРОВАТЬ    

Добавить комментарий:
Ваше имя:
Email:




Консультант по маркетингу баз данных

Перед запуском рекламной кампании в электронной коммерции разрабатываются маркетинговые модели, которые должны в точности отражать маркетинговую стратегию. Интернет-реклама (или интернет-маркетинг) приводит потенциальных клиентов на сайт и требует серьезных инвестиций. Веб-аналитика помогает сделать анализ рекламы, оценить конверсию сайта и посещаемость сайта. В качестве технического средства лучше использовать Google analytics, это очень хороший счетчик посещений сайта, можно сказать лучший из всех бесплатных счетчиков сайтов. На эффективность продвижения юзабилити влияет, но не настолько, как сейчас распространено мнение в сети Инернет. Больше влияют  алгоритмы рекомендаций и навигация на сайте.
Сайты накапливают базу данных клиентов. И анализ интернет-магазинов показывает, что эта информация в маркетинге используется слабо. Business intelligence или bi система позволяет делать сегментацию потребителей по поведению и демографии, а также скоринг вероятности отклика клиента. Data mining инструменты затем используют для проведения кампаний прямого маркетинга (или direct marketing) по базе данных клиентов. OLAP и bsc (сбалансированные показатели) инструменты очень важны для анализа в маркетинге. Bi системы также являются основой любой аналитической CRM системы.
Все это образует электронный маркетинг. Об этом весь сайт KPIs.ru, включая мои лекции по маркетингу.