Datalogy.ru

Карта сайта

Интеллектуальный анализ данных

Использование компьютерных технологий для обработки и хранения данных привело к существенному увеличению их объема. Анализ больших массивов данных является трудновыполнимой задачей для человека, как с точки зрения времени, так и точки зрения эффективности. Основываясь только на собственном опыте, аналитик с достаточно высокой вероятностью может пропустить «скрытые» данные, которые могут принести выгоду. Единственным правильным решением будет использование технологий компьютерного анализа данных – технологии Data Mining (Интеллектуальный анализ данных), являющейся одной из технологий Knowledge Discovery (Обнаружение знаний).

Data Mining – это процесс обнаружения в «сырых» данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Знания должны быть новыми, ранее неизвестными. Под этим подразумевается, что ценность использования технологии представляют собой именно новые знания, способные принести выгоду.
Знания должны быть неочевидны при первом приближении. Раскрытие очевидных знаний, как правило, не требует применения мощных технологий интеллектуального анализа данных.
Практическая полезность полученных знаний является обязательным условием успешного применения технологий Data Mining.
Возможность интерпретации результатов в понятной для человека форме позволяет убедиться, что данные являются не случайными, а доступны для логической оценки человеком.

Решаемые задачи

    Технологии интеллектуального анализа данных позволяют решать множество задач с привлечением методов математической статистики и теории вероятности, а также методов искусственного интеллекта. Наибольшее распространение нашли методы использования, позволяющие решать следующие задачи:

  1. Классификация – отнесение объекта (события, предмета) к одному из заранее известных классов по его характеристикам.
  2. Регрессия – прогнозирование значения какого-либо выходного параметра объекта по набору входных параметров.
  3. Кластеризация – задача заключается в группировке объектов на кластеры (независимых групп) по значениями присущих объектам параметров. Решение этой задачи помогает лучше понять данные.
  4. Поиск ассоциативных правил – выявление закономерностей между какими-либо связанными объектами. Решение этой задачи помогает лучше понять природу анализируемых данных и может служить для прогнозирования появления событий.
  5. Предсказание последовательностей – нахождение зависимостей между объектами или событиями в форме правил, указывающих, что после некоего события A наступает событие B.
  6. Анализ отклонений – анализ данных на предмет вхождения явных нехарактерных шаблонов.

Несмотря на то, что для каждой прикладной задачи анализа данных подходит преимущественно один способ решения, в целом решение задач является зачастую комплексом из применяемых методов интеллектуального анализа данных.

Свяжитесь с нашим специалистом для уточнения деталей нашего предложения.

Записи в блоге RSS-лента блогаRSS