Для начала, любопытный документ от Gartner – Who is who in OpenSource BI.
Данная статья открывает цикл, призванный ознакомить читателя с бесплатными, открытыми и свободными инструментами бизнес-аналитики.
Под BI-платформой Gartner подразумевает набор средств, позволяющих пользователям создавать решения, которые помогают организациям изучать и понимать свой бизнес.
- Арсенал BI-платформ состоит из нескольких инструментов, достаточно обобщённый список которых приведен далее:
- Системы хранения и управления данными: хранилища данных.
- Системы загрузки, очистки и консолидации данных: ETL-инструменты.
- Системы аналитической обработки данных: OLAP-сервера.
- Системы представления результатов анализа: генераторы отчетов, визуализация данных.
- Системы поддержки принятия решений (системы интеллектуального анализа данных).
Результаты исследования Gartner, посвященного поставщикам и разработчикам BI-платформ в 2009 году, отражены на следующем квадранте (Magic Quadrant for Business Intelligence Platforms):
В данном квадранте лишь одну из платформ можно отнести к категории имеющих открытый исходный код – Actuate (речь о ней пойдет ниже).
- Небольшая популярность открытых и бесплатных BI имеет вполне понятные основания:
- процент охвата рынка подобными платформами стремится к нулю;
- с точки зрения конечного потребителя, а ими в данное время являются, как правило, крупные компании, важно иметь стабильную, надежную и хорошо себя зарекомендовавшую систему, то есть продукты со стажем;
- большинство специалистов business intelligence имеют опыт работы именно с лидерами рынка;
Как правило, цена платформы не является определяющей в вопросе выбора BI-платформы, поэтому заказчики и не стараются экономить.
- OpenSource и бесплатные BI-инструменты могут быть полезны в следующих случаях:
- Ограниченные функциональные возможности – нет необходимости во всем многообразии функций.
- Ограниченные финансовые возможности, характерные в первую очередь для малых или средних предприятий.
- Специфические потребности учета, позволяющие внутреннему штату специалистов разработать собственную систему бизнес-аналитики на основе имеющейся открытой системы.
-
- Pentaho BI Suite:
- Pentaho Reporting – дизайнер отчетов;
- Pentaho Data Integration – ETL-модуль для интеграции данных из различных систем с интерфейсом JDBC;
- Pentaho Analysis – OLAP-сервер, поддерживает стандарт MDX;
- Pentaho Data Mining – компонент для интеллектуального анализа данных;
- Pentaho Dashboards – инструмент для создания dashboards и scorecards, анализа KPI.
-
- Palo BI Suite, работает через web-интерфейс:
- Palo ETL Server – ETL-средство, поддерживает РСУБД, web-сервисы, SAP и другие источники данных;
- Palo OLAP Server – ключевой модуль в Palo BI-платформе, предназначенный для хранения данных в виде многомерной модели и позволяющий производить агрегацию в режиме реального времени;
- Palo Worksheet Server – средство для построения отчетности.
- Spago BI, возможности которого наглядно демонстрирует следующая схема:
- Jasper Business Intelligence Suite:
- Jasper Server – является основой для Jasper Reports;
- Jasper Reports – одна из лидирующих систем бизнес-отчетности с открытым исходным кодом, по сути является Java-фреймворком;
- Jasper Analysis – OLAP-сервер, имеющий возможности интеграции с Microsoft Excel и управление через web-интерфейс;
- Jasper ETL – инструмент интеграции данных в хранилища (DataWarehouse), витрины (DataMart) и оперативные склады данных (Operational Data Store);
- iReport – дизайнер JasperReports-отчетов (XML-файлов).
-
- Системы построения бизнес-отчетности и визуализации данных:
- BIRT (Business Intelligence and Reporting Tool) – генератор отчетов;
- Mondrian – часть Pentaho BI Suite, ранее OLAP-сервер, поддерживающий все необходимые функции для отчетности;
- Open Intelligence – web-система построения бизнес-отчетов на основе XMLA, то есть может использовать в качестве OLAP-сервера Microsoft Analysis Services или Mondrian, поддерживает модели Data Mining;
- Freereporting.com – вполне неплохой web-инструмент для построения отчетности;
- RLIB – генератор отчетов из XML-файлов.
-
- ETL – инструменты интеграции, консолидации и загрузки данных:
- Talend Open Studio – достаточно мощное и функциональное средство, обеспечивающее все возможные сценарии интеграции данных:
- Pentaho Kettle – отдельное решение для ETL от компании Pentaho.
- Talend Open Studio – достаточно мощное и функциональное средство, обеспечивающее все возможные сценарии интеграции данных:
-
- Data Mining:
- Weka
- Yale
- RapidMiner
- Knime
Специфичные инструменты:
Список из наиболее популярных opensource и бесплатных BI-платформ:
-






Alexander Sulimanov 