29.5.12

¿Qué es procesamiento analítico en línea (OLAP)?

Las bases de datos del procesamiento analítico en línea (OLAP) facilitan las consultas de la inteligencia empresarial. OLAP es una tecnología de base de datos que se ha perfeccionado para efectuar consultas e informes, en vez de procesar transacciones.

El origen de datos de OLAP son las bases de datos de procesamiento transaccional en línea (OLTP, Online Transactional Processing) que se suelen almacenar en almacenes de datos. Los datos OLAP se derivan de estos datos históricos y se han agregado a estructuras que permiten realizar análisis complejos. Además, se organizan jerárquicamente y se almacenan en cubos en vez de en tablas.

Se trata de una tecnología compleja que usa estructuras multidimensionales para proporcionar un acceso rápido a los datos con el fin de efectuar un análisis. Esta organización permite que un informe de tabla dinámica o gráfico dinámico muestre resúmenes de alto nivel, como totales de ventas en todo un país o región, así mismo los detalles de los sitios en los que las ventas son especialmente altas o bajas.

Las bases de datos OLAP están diseñadas para agilizar la recuperación de datos. Puesto que es el servidor OLAP y no Microsoft Office Excel el que calcula los valores resumidos, hay que enviar menos datos a Excel cuando se cree o se cambie un informe. Esta posibilidad permite trabajar con cantidades mucho mayores de datos de origen que si los datos estuvieran organizados en una base de datos tradicional, en la que Excel recupera todos los registros y después calcula los valores resumidos.

Las bases de datos OLAP contienen dos tipos básicos de datos: medidas, que son datos numéricos, las cantidades y los promedios que usa para tomar decisiones empresariales razonadas, y dimensiones, que son las categorías que usa para organizar estas medidas. Las bases de datos OLAP le ayudarán a organizar los datos mediante muchos niveles de detalle, con las mismas categorías que le son familiares para analizar los datos.

En las siguientes secciones se describe cada uno de estos componentes con más detalle:

Cubo

Estructura de datos que agrega las medidas mediante los niveles y jerarquías de cada una de las dimensiones que desee analizar. Los cubos combinan varias dimensiones, como tiempo, geografía y líneas de productos, con datos resumidos, como cifras de ventas o inventario. Los cubos no son "cubos" en el sentido estrictamente matemático porque no tienen que tener lados iguales. Sin embargo, son una metáfora adecuada para un concepto complejo.

Medida

Conjunto de valores basados en una columna de la tabla de hechos del cubo y que suelen ser valores numéricos. Las medidas son los valores centrales del cubo que se preprocesan, agregan y analizan. Entre los ejemplos normales cabe destacar las ventas, los beneficios, los ingresos y los costos.

Elemento

Elemento de una jerarquía que representa una o varias repeticiones de datos. Un miembro puede ser único o no único. Por ejemplo, 2007 y 2008 representan miembros únicos en el nivel de años de una dimensión de tiempo, mientras que enero representa un miembro no único en el nivel de meses ya que puede haber varios eneros en la dimensión de tiempo si ésta contiene datos de varios años.

Elemento calculado

Elemento de una dimensión cuyo valor se calcula en tiempo de ejecución mediante una expresión. Los valores de los elementos calculados se pueden derivar de otros valores de elementos. Por ejemplo, un elemento calculado, Beneficios, se puede determinar restando el valor del elemento, Costos, del valor del elemento, Ventas.

Dimensión

Conjunto de una o varias jerarquías de niveles de un cubo que comprende un usuario y utiliza como base para el análisis de datos. Por ejemplo, una dimensión geográfica puede incluir niveles de país o región, estado o provincia y ciudad. O bien, una dimensión de tiempo puede incluir una jerarquía con niveles de año, trimestre, mes y día. En un informe de tabla o gráfico dinámicos, cada jerarquía se convierte en un conjunto de campos que puede expandir o contraer para revelar niveles inferiores o superiores.

Jerarquía

Estructura de árbol lógica que organiza los elementos de una dimensión tal que cada elemento tiene un elemento principal y cero o más elementos secundarios. Un elemento secundario es un elemento en el nivel inmediatamente inferior de una jerarquía que está directamente relacionada con el elemento actual. Por ejemplo, en una jerarquía de tiempo que contiene los niveles Trimestre, Mes y Día, enero es un elemento secundario de Trim 1. Un elemento principal es un elemento en el nivel inmediatamente superior de una jerarquía que está directamente relacionado con el miembro actual. El valor principal suele ser una consolidación de los valores de todos sus elementos secundarios. Por ejemplo, en una jerarquía de tiempo que contiene los niveles Trimestre, Mes y Día, Trim 1 es el elemento principal de enero.

Nivel

En cada jerarquía, los datos se pueden organizar en niveles inferiores y superiores de detalle, como los niveles Año, Trimestre, Mes y Día de una jerarquía de tiempo.