Datalogy.ru

Карта сайта

Ландэ Д.В. «Поиск знаний в Internet»

back Книга посвящена современным подходам к получению новых знаний на основе анализа информационного пространства сети Internet и методам обработки информационных потоков с целью выявления значимых тенденций, понятий, феноменов, их взаимосвязей. Анализируются проблемы и феномены Internet, топология Web-пространства, методы доступа к информации в «скрытом» Web, рассматриваются особенности различных информационно-поисковых систем и средства интеграции Web-контента на основе XML. Большое внимание в книге уделено новому направлению обработки текстовой информации – «глубинному анализу текстов» (Text Mining), объединяющему в себе технологические и методологические подходы контент-анализа, компьютерной лингвистики и искусственного интеллекта.

Купить на Ozon.ru.
Читать на Google-книгах.

  Alexander Sulimanov

Технология извлечения данных из интернета

Многие компании в настоящее время, благодаря модной тенденции, обзавелись собственными интернет-магазинами. Зачастую при проектировании в них уделяется очень много внимания оперативной обработке заказов, удобству использования. В действительности это очень важно. Однако, при этом практически всегда игнорируется очень большое количество данных, относящихся к поведению пользователя на сайте, что на самом деле является не менее важным. Можно сказать, что большинство компаний, использующих интернет-магазины, забывают, что успех в электронной коммерции зависит в большей степени от того, насколько данные в магазине способны превратить простых посетителей в покупателей. Поведенческие веб-данные, которые создаются с одной продажи, ценны практически всегда больше чем сумма самой продажи, поскольку на основании этих данных можно придти к длительным и более прибыльным взаимоотношениям с этим клиентом. О взаимодействии пользователя с сайтом и какую пользу можно вынести из генерируемых при этом данных, речь пойдет ниже.

Читать далее »

  Alexander Sulimanov

Semantic Web – Введение

Семантическая паутина (англ. Semantic Web) – часть глобальной концепции развития сети Интернет, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, однозначно характеризующими свойства и содержание ресурсов Всемирной паутины, вместо используемого в настоящее время текстового анализа документов. Термин впервые введён сэром Тимом Бернерсом-Ли в мае 2001 года в журнале «Scientific American», и называется им «следующим шагом в развитии Всемирной паутины». В семантической паутине предполагается повсеместное использование, во-первых, универсальных идентификаторов ресурсов (URI), а во-вторых, онтологий и языков описания метаданных. Эта концепция была принята и продвигается Консорциумом W3. Для её внедрения предполагается создание сети документов, содержащих метаданные о ресурсах Всемирной паутины и существующей параллельно с ними. Тогда как сами ресурсы предназначены для восприятия человеком, метаданные используются машинами (поисковыми роботами и другими интеллектуальными агентами) для проведения однозначных логических заключений о свойствах этих ресурсов.

  Alexander Sulimanov

Подборка ссылок по теме “Анализ данных”

    Data Mining

  • KDnuggets
    Ресурс посвящен технологиям Data Mining, Web Mining, Analytics, Knowledge Discovery, а так же многим подобным.
  • BaseGroup Labs
    Анализ бизнес информации
  • MachineLearning.ru
    Профессиональный информационно-аналитический ресурс, посвящённый машинному обучению, распознаванию образов и интеллектуальному анализу данных.

Читать далее »

  Alexander Sulimanov