Как работают рекомендации. Часть 2
Просмотров: 6331 | 10 июня 2009 | Комментариев: (3)
| More

Как работают рекомендации. Часть 2 Публикую очень важные и интересные материалы про системы рекомендаций.
Дополнительно можно прочитать:
1) [n]Как работаю рекомендации. Часть 1[/n]
2) [n]Видео про рекомендации на Ozon.ru[/n]

С этим товаром часто покупают и коллаборативная фильтрация


Выкладываю алгоритм, который использует Amazon.com для построения рекомендаций типа "с этим товаром часто покупают".
По-другому алгоритм называется [n]Slope One (wikipedia)[/n]. Суть его состоит в том:
a) что вначале строится матрица в строках которых находятся товары, в столбцах - клиенты. В пересечениях матрицы:
1 - если клиент покупал товар, 0 - если нет.
b) Затем для каждой пары товар-товар вычисляет косинус угла между этими товарами.
c) Для рекомендаций выводятся пары товаров, у которых значение косинуса близко к единице
amazon
View more PDF documents from rzykov.

Где этот алгоритм можно использовать?
Это не только e-commerce, но и новостные сайты, социальные сети, везде, где у вас есть логи посещений.

Netflix, Cinematch, Приз 1 млн. долларов


Есть хорошая компания [n]Netflix[/n], которая занимается сдачей в аренду DVD фильмов по подписке. И у этой компании есть очень хороший алгоритм рекомендаций Cinematch. Он настолько хорош, что они решили устроить конкурс [n]1 млн. долларов тому, кто сделает алгоритм, дающий ошибку на 10 % меньше, чем Cinematch[/n].
Конкурс стартовал 2 октября 2006 года и продлится до октября 2011 года. За три года никто не смог выполнить эту задачу, но есть несколько команд, которые уже близки к результату, список [n]здесь[/n].
Каждый год Netflix выплачивает премии командам, которые подошли близко к результату. По условиям конкурса команды должны выкладывать описание их алгоритмов.
В 2008 году была признана лучше команда [n]BellKor in BigChaos[/n]. Их алгоритмы опубликованы на их страничке. Также есть видео [n]презентации[/n] и секции [n]вопросов и ответов[/n].
Также я нашел видео и презентацию Джима Бенетта, который сделал алгоритм Cinematch в Netflix

Видео:

Если Вам понравилась эта статья, подпишитесь на RSS ленту.

| More
 (голосов: 2)



Ссылки для копирования:




#1 Автор: Гера
Дата: 11 июня 2009 10:46
Презентацию усвоил, но остался вопрос по поводу момента
b) Затем для каждой пары товар-товар вычисляет косинус угла между этими товарами.

Косинус между векторами в N мерном евклидовом пространстве считается как векторное произведение деленное на произведение норм, с нормами все ясно, а каким обрызом в данном случае просчитывается векторное произведение? Если опять же оперировать математическими терминами то векторное произведение будет вычисляться через сумму произведений символа Леви-Чевита на соответствующие координаты. Все ли я правильно понял?
Формулу для вычисления векторного произведения векторов размерности больше 3 можно увидеть на википедии под пунктом "Размерности, не равные трём" в самом конце статьи.
Зарегистрирован: -- | ICQ: -- |
ЦИТИРОВАТЬ    

#2 Автор: rzykov
Дата: 11 июня 2009 11:27
см. вычисление косинуса на трехмерном пространстве. http://en.wikipedia.org/wiki/Slope_One

аналогично считается и для n-мерного
Зарегистрирован: 12.01.2007 | ICQ: -- |
ЦИТИРОВАТЬ    

#3 Автор: Паата Бадриевич Джикидзе
Дата: 18 июня 2010 09:00
По контексту: косинус считается как скалярное произведение, не векторное.

Проверка: косинус вектора с собой же -- единица. Синус -- ноль. Считают ведь близость, а не отклонение.

И еще: косинус (скалярное произведение) имеет размерность "единица", т.е. это число. Векторное же произведение -- это вектор.

Как то так.

Паата Бадриевич Джикидзе
http://paata.moikrug.ru/
Зарегистрирован: -- | ICQ: -- |
ЦИТИРОВАТЬ    

Добавить комментарий:
Ваше имя:
Email:




Консультант по маркетингу баз данных

Перед запуском рекламной кампании в электронной коммерции разрабатываются маркетинговые модели, которые должны в точности отражать маркетинговую стратегию. Интернет-реклама (или интернет-маркетинг) приводит потенциальных клиентов на сайт и требует серьезных инвестиций. Веб-аналитика помогает сделать анализ рекламы, оценить конверсию сайта и посещаемость сайта. В качестве технического средства лучше использовать Google analytics, это очень хороший счетчик посещений сайта, можно сказать лучший из всех бесплатных счетчиков сайтов. На эффективность продвижения юзабилити влияет, но не настолько, как сейчас распространено мнение в сети Инернет. Больше влияют  алгоритмы рекомендаций и навигация на сайте.
Сайты накапливают базу данных клиентов. И анализ интернет-магазинов показывает, что эта информация в маркетинге используется слабо. Business intelligence или bi система позволяет делать сегментацию потребителей по поведению и демографии, а также скоринг вероятности отклика клиента. Data mining инструменты затем используют для проведения кампаний прямого маркетинга (или direct marketing) по базе данных клиентов. OLAP и bsc (сбалансированные показатели) инструменты очень важны для анализа в маркетинге. Bi системы также являются основой любой аналитической CRM системы.
Все это образует электронный маркетинг. Об этом весь сайт KPIs.ru, включая мои лекции по маркетингу.