Многие компании в настоящее время, благодаря модной тенденции, обзавелись собственными интернет-магазинами. Зачастую при проектировании в них уделяется очень много внимания оперативной обработке заказов, удобству использования. В действительности это очень важно. Однако, при этом практически всегда игнорируется очень большое количество данных, относящихся к поведению пользователя на сайте, что на самом деле является не менее важным. Можно сказать, что большинство компаний, использующих интернет-магазины, забывают, что успех в электронной коммерции зависит в большей степени от того, насколько данные в магазине способны превратить простых посетителей в покупателей. Поведенческие веб-данные, которые создаются с одной продажи, ценны практически всегда больше чем сумма самой продажи, поскольку на основании этих данных можно придти к длительным и более прибыльным взаимоотношениям с этим клиентом. О взаимодействии пользователя с сайтом и какую пользу можно вынести из генерируемых при этом данных, речь пойдет ниже.
Каждый посетитель электронного магазина порождает важные потребительские поведенческие данные, в не зависимости от того, купил ли он что-нибудь или просто зашел посмотреть. Каждое действие посетителя говорит о некоторых препочтениях, привычках и вкусах покупателя. На основании веб-данных можно выявить важные тенденции и закономерности, которые могут помочь компании спроектировать сайт так, что бы пользоваться его услугами и совершать покупки посетителям стало удобней и легче. В целом веб-данные могут быть использованы с тем, что бы узнать кто и как покупает и что пользуется спросом, а что нет и почему.
1. Появление веб-данных
Каждое посещение вашего сайта очень важно, так как сигнализирует о потребительском интересе к вашим товарам или услуге. К сожалению, поведенческие данные очень разнообразны и объемны. Поэтому до непосредственно анализа веб-данных необходимо собрать и обработать данные из разнородных источников, таких как, например, логи сервера или базы данных отправленных через сайт форм, а так же сообщения электронной почты, присланные от посетителей. Процесс обработки можно облегчить с помощью заблаговременного планирования, с помощью которого возможно точно знать, какие данные необходимо получить. Благодаря внимательному и детальному рассмотрению общей структуры сайта, по ссылкам с главной страницы сайта можно построить карту перемещений посетителей. Можно так же добавить небольшую и необязательную форму обратной связи или регистрации в процессе посещения вашего сайта, с помощью которой можно получать дополнительную информацию о клиенте.
Для идентификации посетителей сайта и сбора информации может использоваться уникальный идентификатор посетителя, к которому привязываются данные о посещении. Существует проверенный способ получить информацию о посетителе: заставить его зарегистрироваться на сайте, что бы пользоваться какой-либо услугой или предоставить какой-либо стимул после регистрации. После регистрации на компьютере посетителя устанавливается специальный маркер, который может быть использован в качестве уникального идентификационного номера. С этим уникальным номером связаны данные лог-файлов, данные заполненных форм и тому подобная информация, накапливающаяся в хранилищах данных компании. Таким образом, с помощью этого уникального идентификатора можно отслеживать все посещения отдельно взятого пользователя.
2. Обработка получаемых веб-данных
Полученные данные необходимо правильно интерпретировать. Качество информации во многом зависит от выбора способа интерпретации. Журналы посещений (текстовые логи посещений, хранящиеся на сервере) содержат техническую информацию о посетителе: используемый провайдер, с которого пришел посетитель, время посещения, список ключевых слов и поисковые системы, использованные посетителями и т.д. – вся эта информация в некоторой степени поможет понять, как посетитель пришел на сайт и какие ключевые слова при этом использовал (помогают понять причину посещения). По хранимым у пользователя кукам (cookies) можно отследить визиты посетителя, а так же выявить некоторые закономерности в перемещениях по сайту у конкретных пользователей. Личную информацию, такую как пол, возраст, почтовый адрес, возможно получить с помощью форм. Эти данные, пожалуй, являются наиболее важными, поскольку содержат информацию, которая может быть использована для связи с уже имеющейся информацией о клиентах в корпоративном хранилище данных (Data Warehouse). Вообще, не существует каких-либо ограничений на количество и характер информации, запрашиваемой у посетителей веб-ресурсов, многое зависит от их тематики и контекста. Не исключено, что кому-то могут пригодиться данные о марке автомобиля или числе детей в семье и т.д. Эта “внешняя” информация может быть связана с данными общеизвестных поставщиков различного рода информации (Acxiom, Equifax, Experian, Polk и многие другие) и дать дополнительную информацию о личности посетителя, его образе жизни. Существует целая отрасль, посвященная сегментации, классификации и перепродаже данных о поведении потребителей частным компаниям, в том числе любым веб-сайтам. Кроме этого, в последнее время появились поставщики, предлагающие программное обеспечение или услуги по фильтрации, профилированию данных о посетителях и реляционному маркетингу. Подобные поставщики представляют собой совершенно новый вид веб-студий, которые занимаются исключительно получением информации о поведении и предпочтениях интернет-пользователей. Список компаний включает DoubleClick, Net.Perseptions и другие. Состав инструментов для отслеживания и профилирования данных о поведении пользователей достаточно обширен – все из патентованного программного обеспечения и баз данных до смешанных маркеров, устанавливаемых на компьютерах пользователей.
В итоге получаемая информация может быть помещена в таблицу реляционной базы данных или обычный плоский файл, которые могут использоваться в качестве источников данных для инструментов data mining. К таким инструментам относятся автоматизированные инструменты, используемые главным образом в хранилищах данных для распознавания скрытых закономерностей, шаблонов и связей в данных, а так же инструменты визуального моделирования полученных данных, используемые главным образом не техническими специалистами – маркетологами и менеджерами. В том или ином случае, модели данных и результаты поиска с использованием алгоритмов data mining могут быть представлены в различных форматах, понятных людям принимающим бизнес-решения, а так же тем, кто отвечает за дизайн и техническое исполнение электронного ресурса.
До недавнего времени анализ веб-данных представлял из себя анализ логов посещений, большинство из которых представляют совокупные данные активности перемещений посетителей на сайте, но не представлял никаких сведений о цели посещения, не говоря уж о демографической статистике пользователей.
Большая часть программных продуктов, в том числе NetIntellect, Bazaar Analyzer Pro, HitList, NetTracker, Surf Report, WebTrends и другие предполагают использование лог-файлов на сервере для построения отчетов. Это в основном ограничивает сферу применения этих инструментов данными о доменных именах, IP-адресах, браузерах и другой подобной, в основном, информации технического плана. С другой стороны поиск скрытых закономерностей в веб-данных относится скорее к анализу поведения посетителей, а не к сбору серверной статистики, так как цели посетителей нельзя узнать, зная, например, какой IP-адрес он при этом использовал. Сайту электронной торговли необходимо знать предпочтения и образ жизни своих посетителей. В этом ключе технология Data Mining может помочь ответить на вопросы следующего плана: кто покупает, какие предметы и за какие цены. Ответы на подобные вопросы способствуют более рациональному планированию закупок и доставки товаров.
Технология Data Mining относительно новая, но во многом предназначена для решения одного из старейших вопросов человеческой деятельности: распознавание образов, шаблонов. Нашим далеким предкам приходилось распознавать поведение хищников, добычи, их пути, поведение, с целью выживания в суровых условиях. На сегодняшний день владельцы электронных магазинов сталкиваются с подобной задачей выживания в условиях большого объема информации и в результате конкуренции должны применять различные модели поиска закономерностей в поведении покупателей. Одной из особенностей фирм, использующих Data Mining, является необходимость обрабатывать большие массивы транзакционных данных в борьбе за каждого клиента. Трудно привлечь клиента, но зато легко его потерять. Именно этот принцип, если подумать, стал причиной ухода от обычных магазинов и супермаркетов к развитию электронной торговли. Цель торговли в общем – продать товар и обеспечить потребности клиентов в товарах. В классическом случае магазины делают это, имея предположительный образ клиента и его потребности. Благодаря техническим средствам, сопутствующим электронному товарообмену, стало возможным хранить сопутствующую покупкам информацию о самих покупателях. Таким образом, в электронных магазинах изменился способ сбыта товаров: задача состоит в том, чтобы знать в деталях потребности каждого отдельного покупателя и строить с ним долгосрочные, взаимовыгодные отношения. Data Mining является ключом к клиенту в конкурентной борьбе на переполненном рынке и необходима для выживания. Таким образом, искусственный интеллект (ИИ) в виде технологии Data Mining стал основой для ведения бизнеса на стремительно развивающемся рынке электронных услуг.
Список алгоритмов Data Mining выглядит следующим образом: ассоциативные правила, сегментация, кластеризация, классификация, предсказательные модели и др. В качестве примера можно рассмотреть использование алгоритмов Data Mining для сегментации информации о посещениях сайта по уникальным группам посетителей. Этот процесс происходит независимо от аналитика или продавца и самостоятельно выявляет ключевые шаблоны или закономерности в данных. Результатом работы может служить дерево решений, которое по сути является графическим способом записи правил “Если/То”. В данном конкретном примере речь идет о Web Mining, технологии извлечения знаний из Web-хранилищ. Подобное использование алгоритма сегментации позволяет продавцу сделать некоторые прогнозы относительно покупательной способности своих потенциальных клиентов в виде бизнес-правил, которые могут быть извлечены непосредственно из веб-данных:
ЕСЛИ ключевое слово поиска “Офисные приложения” И это мужчина 24-29 лет, ТО средняя прогнозируемая сумма продажи составляет = 3000 руб.
ИЛИ
ЕСЛИ ключевое слово поиска “Графические программы” И посетитель пришел с сайта “Adobe.com”, ТО средняя прогнозируемая сумма продажи составляет 5000 руб.
В качестве альтернативы сегментации склонность клиента к покупке может быть определена с помощью еще одного из алгоритмов data mining: нейронных сетей с обучением, например, по методу обратного распространения ошибки. В целом, нейронные сети могут быть использованы для построения моделей поведения клиента, на основании которых могут быть сделаны некоторые прогнозы их поведения. Нейронные сети имитируют модель мозга при принятии решения и могут частично воспроизводить его функции. Возможность обучения является ключевой для нейронных сетей. Иными словами, нейронные сети, обучаясь на каких-либо реальных данных (называемых обучающим множеством), в процессе использования позволяют строить прогнозные модели поведения посетителей и выявлять те или иные закономерности. Так же как и в биологическом мозге, нейронные сети (судя еще и по названию) представляют собой множество нейронов с нелинейными связями между собой. Как раз-таки синоптические связи и определяют во многом функционирование нейронной сети, веса которых зависят от взаимосвязей между данными.
Продолжение следует…

Alexander Sulimanov