Datalogy.ru

Карта сайта

Free & OpenSource Business Intelligence

Для начала, любопытный документ от GartnerWho is who in OpenSource BI.

Данная статья открывает цикл, призванный ознакомить читателя с бесплатными, открытыми и свободными инструментами бизнес-аналитики.
Под BI-платформой Gartner подразумевает набор средств, позволяющих пользователям создавать решения, которые помогают организациям изучать и понимать свой бизнес.

    Арсенал BI-платформ состоит из нескольких инструментов, достаточно обобщённый список которых приведен далее:

  1. Системы хранения и управления данными: хранилища данных.
  2. Системы загрузки, очистки и консолидации данных: ETL-инструменты.
  3. Системы аналитической обработки данных: OLAP-сервера.
  4. Системы представления результатов анализа: генераторы отчетов, визуализация данных.
  5. Системы поддержки принятия решений (системы интеллектуального анализа данных).


Результаты исследования Gartner, посвященного поставщикам и разработчикам BI-платформ в 2009 году, отражены на следующем квадранте (Magic Quadrant for Business Intelligence Platforms):

Квадрант Gartner для BI-платформ

Квадрант Gartner для BI-платформ

В данном квадранте лишь одну из платформ можно отнести к категории имеющих открытый исходный код – Actuate (речь о ней пойдет ниже).

    Небольшая популярность открытых и бесплатных BI имеет вполне понятные основания:

  • процент охвата рынка подобными платформами стремится к нулю;
  • с точки зрения конечного потребителя, а ими в данное время являются, как правило, крупные компании, важно иметь стабильную, надежную и хорошо себя зарекомендовавшую систему, то есть продукты со стажем;
  • большинство специалистов business intelligence имеют опыт работы именно с лидерами рынка;

Как правило, цена платформы не является определяющей в вопросе выбора BI-платформы, поэтому заказчики и не стараются экономить.

    OpenSource и бесплатные BI-инструменты могут быть полезны в следующих случаях:

  1. Ограниченные функциональные возможности – нет необходимости во всем многообразии функций.
  2. Ограниченные финансовые возможности, характерные в первую очередь для малых или средних предприятий.
  3. Специфические потребности учета, позволяющие внутреннему штату специалистов разработать собственную систему бизнес-аналитики на основе имеющейся открытой системы.

      Список из наиболее популярных opensource и бесплатных BI-платформ:

      • Pentaho BI Suite:

      • Pentaho Reporting – дизайнер отчетов;
      • Pentaho Data Integration – ETL-модуль для интеграции данных из различных систем с интерфейсом JDBC;
      • Pentaho Analysis – OLAP-сервер, поддерживает стандарт MDX;
      • Pentaho Data Mining – компонент для интеллектуального анализа данных;
      • Pentaho Dashboards – инструмент для создания dashboards и scorecards, анализа KPI.
      • Palo BI Suite, работает через web-интерфейс:

      • Palo ETL Server – ETL-средство, поддерживает РСУБД, web-сервисы, SAP и другие источники данных;
      • Palo OLAP Server – ключевой модуль в Palo BI-платформе, предназначенный для хранения данных в виде многомерной модели и позволяющий производить агрегацию в режиме реального времени;
      • Palo Worksheet Server – средство для построения отчетности.
    1. Spago BI, возможности которого наглядно демонстрирует следующая схема:

      Spago BI

      Spago BI

    2. Jasper Business Intelligence Suite:
      • Jasper Server – является основой для Jasper Reports;
      • Jasper Reports – одна из лидирующих систем бизнес-отчетности с открытым исходным кодом, по сути является Java-фреймворком;
      • Jasper Analysis – OLAP-сервер, имеющий возможности интеграции с Microsoft Excel и управление через web-интерфейс;
      • Jasper ETL – инструмент интеграции данных в хранилища (DataWarehouse), витрины (DataMart) и оперативные склады данных (Operational Data Store);
      • iReport – дизайнер JasperReports-отчетов (XML-файлов).
      • JasperSoft BI Suite

        JasperSoft BI Suite

        Специфичные инструменты:

        • Системы построения бизнес-отчетности и визуализации данных:

        • BIRT (Business Intelligence and Reporting Tool) – генератор отчетов;
        • Mondrian – часть Pentaho BI Suite, ранее OLAP-сервер, поддерживающий все необходимые функции для отчетности;
        • Open Intelligence – web-система построения бизнес-отчетов на основе XMLA, то есть может использовать в качестве OLAP-сервера Microsoft Analysis Services или Mondrian, поддерживает модели Data Mining;
        • Freereporting.com – вполне неплохой web-инструмент для построения отчетности;
        • RLIB – генератор отчетов из XML-файлов.
        • ETL – инструменты интеграции, консолидации и загрузки данных:

        • Talend Open Studio – достаточно мощное и функциональное средство, обеспечивающее все возможные сценарии интеграции данных:
          talend-1

          talend-2

          talend-3

        • Pentaho Kettle – отдельное решение для ETL от компании Pentaho.
  Alexander Sulimanov