sábado, 25 de febrero de 2012

INTRODUCCIÓN

Desde el inicio de la era de la computación las organizaciones han usado los datos desde sus sistemas operacionales para atender sus necesidades de información. Algunas proporcionan acceso directo a la información contenida dentro de las aplicaciones operacionales. Otras, han extraído los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de información.

Ambos métodos han evolucionado a través del tiempo y ahora las organizaciones manejan datos aislados e incompletos, sobre los cuales, en la mayoría de las veces, se toman importantes decisiones.

La razón principal es la manera en que han evolucionado las computadoras, basadas en las tecnologías de información y los sistemas. La mayoría de las organizaciones hacen lo posible por conseguir buena información, pero el logro de ese objetivo depende, fundamentalmente, tanto de su arquitectura actual, como del hardware y software.



lunes, 20 de febrero de 2012

Que Es OLAP (Business Intelligence)?




OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la Inteligencia de Negocios (Business Intelligence), la cual consiste en consultas a estructuras multidimensionales (o Cubos OLAP y que le permite al usuario tener una visión más rápida e interactiva de los mismos. Se usa en informes de negocios de ventas, márketing, informes de dirección, minería de datos y áreas similares.

Este análisis, también conocido como análisis del hipercubo, organiza la información según los parámetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendrá la información requerida.

Es muy utilizado en el área de marketing, ventas, informes, etc., especialmente porque las respuestas a consultas complejas se obtienen muy rápidamente y además porque puede obtener los datos tanto de una fuente externa como de una base interna.

La razón de usar OLAP para las consultas es la velocidad de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas, aunque peor desde el punto de vista operativo, es una base de datos multidimensional. La principal característica que potencia a OLAP, es que es lo más rápido a la hora de hacer selects, en contraposición con OLTP que es la mejor opción para INSERTS, UPDATES Y DELETES.


Existen algunas clasificaciones entre las implementaciones OLAP.

ROLAP es una implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella ó copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esa arquitectura es que permite el análisis de una enorme cantidad de datos.

MOLAP es una implementación OLAP que almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la infomación es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganacias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.

HOLAP (Hybrid OLAP) almacena algunos datos en un motor relacional y otros en una base de datos multidimensional

DOLAP es un OLAP orientado a equipos de escritorio (Desktop OLAP). Trae toda la información que necesita analizar desde la base de datos relacional y la guarda en el escritorio. Desde ese momento, todas las consultas y análisis son hechas contra los datos guardados en el escritorio.


OLAP: Una manera de acceder a tu información utilizando un “lenguaje natural”.

Esta señora selecciona su pizza filtrando todas las pizzas posibles a través de sus características relevantes. 

En el mundo corporativo, los analistas acceden a la información filtrando sus indicadores de negocio por regiones, por producto, por tiempo... 

A partir de esta definición básica, existen distintas tecnologías que lo implementan (ROLAP, MOLAP,...), pero básicamente todas hacen las mismas acciones básicas sobre la información: 

  • Segmentar: ventas por producto y por trimestre
  • Filtrar: informe de ventas en un año
  • Profundizar (Drill down): Los datos de trimestre 2 y miramos el desglose de abril, mayo, junio.
  • Sintetizar (Drill up): Deshacer el desglose anterior y vuelves al desglose por trimestre.
  • Rotar (Drill anywhere): Cuando en lugar de pasar de un desglose por trimestres a uno mensual, te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una característica de una jerarquía distinta a la que lo estas viendo actualmente.






domingo, 19 de febrero de 2012

ANÁLISIS AVANZADOS Y PREDICTIVOS

Los análisis avanzados y predictivos ofrecen a los usuarios de negocio avanzados y a los analistas de información la posibilidad de investigar exhaustivamente para buscar los detalles escondidos tras los resultados específicos de rendimiento. Estos requisitos exceden normalmente los límites del análisis OLAP.

 Se ha creado un entorno que permite a los usuarios pasar de forma transparente del análisis OLAP básico al análisis estadístico avanzado y a las posibilidades completas. Nuestra tecnología se ha diseñado específicamente para ofrecer la funcionalidad común de las herramientas estadísticas de una forma que resulte familiar y coherente con el uso cotidiano.


Nuestra plataforma soporta análisis avanzados y predictivos, que permiten a los usuarios realizar por primera vez análisis como comprobación de hipótesis, predicción de actividad y modelos de segmentación de cliente, todo ello en un interface Web unificado. Con soporte integrado para más de 400 funciones estadísticas, matemáticas y financieras, permite a los usuarios crear aplicaciones que combinen la facilidad de uso sofisticado e inigualable.

  • SEGMENTAR
Análisis de conjuntos y segmentación de datos. Los usuarios pueden aprovechar los conjuntos de análisis que proporciona para realizar una segmentación sencilla de los datos. Pueden manipular y combinar conjuntos de datos definidos por el usuario para obtener un conjunto de datos depurado para su posterior análisis. El análisis de conjuntos es una parte esencial de la plataforma de y se puede aplicar al almacén de datos completo. Los conjuntos se pueden personalizar por usuario, compartir en un departamento, combinar mediante operadores lógicos y reutilizar en múltiples informes.
 
  • FILTRAR
Los usuarios pueden crear informes personalizados seleccionando objetos de datos para mostrar y definir calificaciones como criterios de filtro del informe. Ofrece varios enfoques guiados para crear informes nuevos - desde preguntas paso a paso al usuario para seleccionar y calificar los atributos y métricas empresariales hasta asistentes que incorporan plantillas y filtros existentes.


  • PROFUNDIZAR
Proporciona el conjunto más amplio y exhaustivo de funciones analíticas disponible en cualquier plataforma. Incluyen desde simples funciones matemáticas, como totales actualizados, a cálculos estadísticos avanzados como los f-tests. Los paquetes analíticos
disponibles incluyen bibliotecas de funciones estadísticas, financieras y matemáticas. Esto permite a la empresa obtener respuesta a todos sus análisis utilizando una sola plataforma.

  •  SINTETIZAR
La plataforma ofrece análisis SQL iterativo multi-paso, una técnica que combina las funciones analíticas integradas con proceso de base de datos. Preguntas complejas que son imposibles de resolver con otras soluciones obtienen respuesta de forma rápida y fácil. Al combinar potentes funciones analíticas con el motor de generación SQL líder en el sector, pone al alcance de todos los usuarios posibilidades inigualables de análisis.

  • ROTAR
Cambiar dimensiones unas con otras. Ej.: salidas por ítems vs. ítems por salida. Cuando en lugar de pasar de un desglose por trimestres a uno mensual, te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una característica de una jerarquía distinta a la que lo estas viendo actualmente.

ENLACES DE INTERES:

Introduccion a Pentaho
Analizis aoalpa con Pentaho
Como Instalar y Requerimientos Pentaho 
Como crear un Cubo multidimencional OLAP usando Pentaho
Funciones OLAP en Microsoft Excel
Microsoft Dynamics AX con OLAP
Inteligencia de Negocios: Conceptos y Aplicaciones con Pentaho  (pdf)
Productos de fuente abierta de inteligencia de negocios

  • Eclipse BIRT Project: Generador de informes para aplicaciones Web de código abierto basado en Eclipse
  •     JasperReports
  •     LogiReport: Aplicación de BI gratuita basada en Web de LogiXML
  •     OpenI: Aplicación Web simple orientada al reporting OLAP.
  •     Palo:
  •     Pentaho
  •     RapidMiner (antes YALE):
  •     SpagoBI:



Productos comerciales
  •     Microsoft SQL Server - Suite de Herramienta de BI (Analysis Services, Integration Services   y reporting Services)
  •     ACE*COMM
  •     Actuate
  •     ApeSoft (http://www.apesoft.es)
  •     Applix
  •     Bitool Herramienta de ETL y Visualizacion
  •     BiPoint - Business Intelligence
  •     Bingo Intelligence (http://www.bingointelligence.com)
  •     Business Objects (SAP company)|Business Objects
  •     CA Oblicore Guarantee
  •     CODISA BI
  •     CP CORPORATE PLANNING (CP[1])
  •     IBM Cognos
  •     ComArch
  •     CyberQuery
  •     Crystal Reports
  •     DataCyCle Reporting
  •     Dimensional Insight
  •     dLife (Apara)
  •     dVelox (Apara)
  •     Dynamic Data Web
  •     Hyperion Solutions Corporation(ahora Oracle)
  •     IdeaSoft - Business Intelligence & Performance
  •     Information Builders
  •     InetSoft Technology
  •     LiteBI
  •     LogiXML
  •     Màpex Dynamics
  •     Microsoft Excel
  •     MicroStrategy
  •     NiMbox
  •     Oracle Corporation (busque Oracle Business Intelligence Server ONE)
  •     OutlookSoft
  •     Panorama Software
  •     Pentaho BI
  •     PerformancePoint Server 2007
  •     Pilot software|Pilot Software, Inc.
  •     Prelytis
  •     Proclarity
  •     Prospero Business Suite
  •     QlikView
  •     Jedox
  •     SAP Business Information Warehouse
  •     SAS Institute
  •     Siebel Systems
  •     Spotfire
  •     StatSoft
  •     SPSS
  •     Synerplus
  •     Tacnetting, Inteligencia para la Organizacion
  •     Telerik
  •     Teradata

sábado, 18 de febrero de 2012

Herramientas De Business Intelligence (Open Source)


De todas las inicativas, la más completa es la de Pentaho, que utiliza toda una serie de componentes Open Source muy utilizados y fiables: Mondrian OLAP server, JPivot, Firebird RDBMS, Enhrydra ETL, Shark and JaWE , JBoss, Hibernate, JBoss Portal, Weka Data Mining, Eclipse, BIRT, JOSSO, Mozilla Rhino. 

El SIG de la Generalitat Valenciana es una apuesta muy interesante en el mundo del Open Source para el área GIS, algo no tan habitual como en el BI, y mucho menos si resulta que es un esfuerzo español. gvSIG es una herramienta orientada al manejo de información geográfica. Se caracteriza por una interfaz amigable, siendo capaz de acceder a los formatos más usuales de forma ágil tanto ráster como vectoriales. Integrará en una vista datos tanto locales como remotos a través de un origen WMS o WFS.
Está orientada a usuarios finales de información de naturaleza geográfica, sean profesionales o de administraciones públicas (ayuntamientos, diputaciones, consejerías o ministerios) de cualquier parte del mundo (actualmente dispone de interfaz en castellano, valenciano, inglés,
alemán, checo, euskera, francés, italiano y portugués ), siendo, además, gratuita. 

PALO (que como véis, leido al reves dice OLAP) es la iniciativa que acaba de presentar la firma alemana Jedox. Para resumir, PALO se trata de un motor multidimensional OLAP, que trabaja fundamentalmente con los datos de grandes hojas de cálculo, tipo excel. Mediante un add-in integrado se realizan calculos complejos a gran velocidad, permitiendo además el write-back, esto es, no solo consulta, sino escritura contra la base de datos. La herramienta es Open Source y el add-in es gratuito, por lo que se trata de una gran utilidad para todos aquellos que manejen gran cantidad de datos en Excel.
Evidentemente, no se trata de una solución BI amplia, en el sentido de reporting, análisis, mining, forecasting, etc… pero es un paso muy interesante sobre una herramienta muy popular, como es Excel. Yo le preveo una rápida adopción por parte de ciertos usuarios avanzados de Excel.
Además se apoya en la experiencia de Jedox, con su producto estrella: Worksheet-Server, que permite pasar de forma directa de hojas excel a Web, utilizando tecnologia libre PHP.

Una de las novedades más importantes es el creciente interés que están teniendo empresas con larga tradición comercial en el mercado como es Actuate en estos
productos. No se trata de que ahora vayan a pasarse de bando y no cobrar por sus productos. Lo que hacen es adoptar esta tecnología y ofrecer ciertas partes de los mismos a precios muy competitivos. Como miembros claves de Eclipse BIRT, el proyecto Open Source que esta creando un entorno de desarrollo web para aplicaciones BI, han adoptado el sistema de reporting y charting para una fácil instalación y manejo. Esta es la principal mejora de Actuate. Han creado un “one button installation”. Le han puesto una caja y un lazo, pero el resto es todo tecnología libre. Aportan soporte, training, actualizaciones, etc…
(Este es el valor añadido que quieren obtener). Se puede decir que es muy sencillo de instalar y ponerse a trabajar. Además, el interfaz es muy sencillo de manejar e intuitivo y la ayuda es espectacularmente completa. Permite crear un gran número de informes con gráficos. 

Este proyecto de origen checo, es una gran solución para las empresas de
tamaño medio. Cuenta con una herramienta ETL y un servidor ROLAP. 

Se trata de una solución via web que permite generar cuadros de mando, de forma sencilla pra las pequeñas y medianas empresas. Utilizan un modelo en el que no es necesario instalarse el software ya que puede ser administrado desde sus propios servidores. 

Se trata de una base de datos relacional basada en PostgreSQL.
Puede ser una alternativa a MySQL. Junto a Jasper Reports, han creado una herramienta de cuadro de mando para DBAs. 

Se trata de una base de datos relacional basada en PostgreSQL, pero adaptada al Business Intelligence, bajo el nombre de Bizgres. 

Se trata de una de las soluciones más populares para reporting y que se
encuentra incluida en otras suites BI. Tienen también productos de análisis, pero en este caso, son de pago: Jasper Decisions. 

Se trata de una aplicación Business Intelligence de tipo OLAP construida para acceso web y que permite acceder a datos de SQL Server y Mondrian

Pretende ser una solución completa de Business Intelligence que incluye desde la extracción a la mineria, pasando por análisis y reporting.
Utiliza componentes muy similares a los de Pentaho.

Estas son algunas de las Herramientas Más Conocidas para Business Intelligence
Además trabajan con análisis Multidimensional OLAP