Utilizando a Ferramenta Mondrian para Processamento de um Data Warehouse
sexta-feira, 21 de agosto de 2009
Saiu na edição de agosto (número 67) da SQL Magazine um artigo meu, escrito em parceria com Pablo Tôndolo de Vargas e Mikael de Souza Fernandes, sobre a ferramente open source de Data Warehouse Mondrian.
O capítulo de introdução do artigo, cujo título é “Utilizando a Ferramenta Mondrian para Processamento de um Data Warehouse: WOLAP com ferramenta open-source“, pode ser lido abaixo:
“Introdução
Cada vez mais os administradores de empresas têm a necessidade de analisar e visualizar os dados corporativos independentemente do local onde estejam, sejam em suas casas ou no escritório. Nesse contexto, é necessário rapidez, dinamismo e consistência nos dados para facilitar a tomada de decisão sobre como agir a partir de informações do mesmo.
Como o próprio nome sugere On-Line Analytical Processing (OLAP, em português Processamento Analítico On-Line) tem por finalidade processar grandes quantidades de dados em tempo real. Segundo Kimball(1998), OLAP é um termo criado para descrever uma abordagem dimensional para suporte à decisão, através de uma análise dinâmica e multidimensional dos dados. No entanto, a tecnologia OLAP é somente de visualização de dados que estão numa forma agregada, ou melhor, resumida. Esse resumo é necessário para que se possa analisar os dados dispostos em uma base relacional.
Englobado nos conceitos de OLAP, encontra-se a ferramenta Mondrian, que consiste em um projeto open source que está atualmente na versão 3, desenvolvida pela Pentaho (www.pentaho.com). Mondrian aplica as tradicionais operações OLAP em Esquemas XML. Para definir as consultas na devida base dados, Mondrian utiliza uma outra tecnologia padrão, o MDX (Multidimensional Expressions).
O MDX consiste em uma linguagem semelhante à linguagem SQL (Structured Query Language), foi criada pela Microsoft e introduzida na ferramenta Microsoft SQL Server Services OLAP, fazendo parte da especificação OLE DB/OLAP API. Porém, o Mondrian não possui um visualizador dos dados multidimensionais, podendo assim ser integrado como uma API em outras ferramentas, como o caso do JPivot .
Este artigo tem como objetivo apresentar a ferramenta Mondrian, assim como explorar os conceitos de BI, mostrando o seu significado e como o usuário pode usufruir de seus recursos no dia-a-dia através de uma exemplificação de uma base de dados de uma vídeo-locadora.
A ferramenta Mondrian utiliza a tecnologia JDBC (Java Database Connectivity), logo é flexível quanto a Sistema Gerenciador de Banco de Dados (SGBD). No exemplo não é citado o SGBD utilizado, pois é deixado a rigor de cada um a escolha deste, logo foi utilizada a conexão ODBC (Open Data Base Connectivity) suportada pela tecnologia JDBC.”