CONCEPTO BASICO DE B.I., DATAMART, DATAWERAHOUSE, OLAP.. EJEMPLO DEL DIAGRAMA EN MODELO ESTRELLA O SNOWFLAKE

Ver el tema anterior Ver el tema siguiente Ir abajo

CONCEPTO BASICO DE B.I., DATAMART, DATAWERAHOUSE, OLAP.. EJEMPLO DEL DIAGRAMA EN MODELO ESTRELLA O SNOWFLAKE

Mensaje  ENRIQUE HERNANDEZ P. el Vie Abr 07, 2017 1:19 am

1.- conceptos básicos de:
B.I.:
Es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.
Desde un punto de vista más pragmático, y asociándolo directamente con las tecnologías de la información, podemos definir Business Intelligence como el conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa (reporting, análisis OLTP / OLAP, alertas...) o para su análisis y conversión en conocimiento, dando así soporte a la toma de decisiones sobre el negocio.
La inteligencia de negocio actúa como un factor estratégico para una empresa u organización, generando una potencial ventaja competitiva, que no es otra que proporcionar información privilegiada para responder a los problemas de negocio: entrada a nuevos mercados, promociones u ofertas de productos, eliminación de islas de información, control financiero, optimización de costes, planificación de la producción, análisis de perfiles de clientes, rentabilidad de un producto concreto, etc...
Los principales productos de Business Intelligence que existen hoy en día son:
  Cuadros de Mando Integrales (CMI)
  Sistemas de Soporte a la Decisión (DSS)
  Sistemas de Información Ejecutiva (EIS)

Data Warehouse:
Es un sistema utilizado para la presentación de informes y análisis de datos , y se considera un componente central de inteligencia de negocio . DWs son depósitos centrales de datos integrados de una o más fuentes dispares. Almacenan datos actuales e históricos en un solo lugar y se utilizan para la creación de informes analíticos para los trabajadores del conocimiento en toda la empresa. Ejemplos de informes podrían variar de comparaciones y tendencias anuales y trimestrales a un análisis detallado de ventas diarias.
Los datos almacenados en el almacén se cargan a partir de los sistemas operativos (tales como el marketing o ventas). Los datos pueden pasar a través de un almacén de datos operativos y pueden requerir la limpieza de datos para las operaciones adicionales para asegurar la calidad de los datos antes de que se utiliza en el DW para los informes.
Datamart:
Es una versión especial de almacén de datos (data warehouse). Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de múltiples formas para que diversos grupos de usuarios realicen la explotación de los mismos de la forma más conveniente según sus necesidades.
El Data mart es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos (altas) con una frecuencia baja y conocida. Es consultado mediante herramientas OLAP (On line Analytical Processing - Procesamiento Analítico en Línea) que ofrecen una visión multidimensional de la información. Sobre estas bases de datos se pueden construir EIS (Executive Information Systems, Sistemas de Información para Directivos) y DSS (Decision Support Systems, Sistemas de Ayuda a la toma de Decisiones).
En síntesis, se puede decir que los data marts son pequeños data warehouse centrados en un tema o un área de negocio específico dentro de una organización.
Agregándole otra definición al Datamart.
Podremos decir que Según (Sinnexus, 2016) se trata de una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio especifica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento.
OLAP:
Es una solución utilizada en el campo de la llamada Inteligencia de negocios (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras de datos diversas, normalmente multidimensionales (o Cubos OLAP), que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.
La razón de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas (aunque peor desde el punto de vista operativo) es una base de datos multidimensional.
La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE
2.- ejemplo del modelo estrella o snow-flake:
Modelo estrella:
Es un tipo de Modelo Dimensional, y por lo tanto, tiene como elementos una tabla de Hechos y tablas de Dimensiones. Lo que caracteriza al Modelo en Estrella, y lo diferencia de otros modelos dimensionales como el Modelo de Copo-de-Nieve, es cómo se lleva a cabo la relación entre las tablas de Dimensiones, más en concreto, como se construye la relación entre los distintos niveles dentro de una Dimensión. En el Modelo en Estrella, cada dimensión utiliza únicamente una tabla, en el Modelo en Copo-de-Nieve, una dimensión es representada en varias tablas.
La tabla de Hechos es una tabla que contiene dos tipos de campos: por un lado, las Medidas, que no son más que los datos que vamos a analizar. En un datawarehouse (DW) de ventas, pues serían las ventas. En un DW financiero, serían elementos del Balance (Activo a Corto Plazo, Pasivo Circulante, Acreedores, etc.). En nuestro DW para análisis bursátil, serían los conceptos de Precio de Apertura, Precio de Cierre, etc. El otro tipo de campos incluídos en la tabla de Hechos son las claves que apuntan a los registros de las tablas de dimensiones, y que permiten relacionar los datos con los niveles de las dimensiones. Los valores que forman conjunto de claves forma la Clave Primaria de la tabla de Hechos.
Pongamos un ejemplo de Modelo en Estrella. Un DW de ventas de una distribuidora de productos electrónicos. Tendríamos un modelo dimensional en Estrella como éste:

Ejemplo de Esquema en Estrella
Como vemos, tenemos una tabla de Hechos, cuya clave primaria es id_producto, id_tienda, id_tiempo, y tres dimensiones: dim_producto, dim_tienda, dim_tiempo, es decir, para una tienda, un día del año y un producto solo puede haber un valor para las medidas PRECIO y UNIDADES:

Diseño de la Tabla "HECHOS"
Si ejecutamos una instruccion SQL contra esta tabla ” Hechos” de la forma
SELECT * FROM HECHOS;
obtendríamos

Resultado de una query SELECT en la tabla HECHOS
Veamos ahora las tablas de dimensiones. Cada una de las tres dimensiones de nuestro análisis (“Producto”, “Tienda”, “Tiempo”) son representadas en nuestro Modelo en Estrella en una única tabla. Esta es la característica diferencial con respecto a los Modelos en Copo-de-Nieve.
Entrando en detalle, veamos una dimensión, en concreto la dimensión”Producto”:

Diseño de la tabla de "DIM_PRODUCTO"
y si ejecutamos una consulta SQL contra ella
SELECT * FROM DIM_PRODUCTO;
obtendríamos datos como estos (como el SELECT no filtra la tabla, y ésta tiene más registros, solo mostramos un extracto de los mismos):

Resultado de una query SELECT en la tabla "DIM_PRODUCTO"
Como observamos, en esta tabla hay campos que tienen el mismo valor una y otra vez, por ejemplo, el campo fabricante es “BLUSENS” (que es una marca española de Tecnología).

Modelo snow-flake:
También conocida como (copo de nieve) Es una estructura más compleja. Se da cuando existen un gran número de tablas fact, sin que sea factible reducir su número. Aunque puede reducir espacio, tiene la contrapartida de peores rendimientos al tener que crear mas tablas de dimensiones y más joins, lo que tiene un impacto directo sobre el rendimiento.
Si, tenemos en cuenta que, hoy en día, el espacio en disco no suele ser un problema, y si el rendimiento, se presenta con una mala opcion en DW.
Se puede usar en DW realmente grandes y complejos, pero nunca en sistemas que requieran respuestas rápidas para los usuarios.


ATT: ENRIQUE HERNANDEZ PEDROZA

ENRIQUE HERNANDEZ P.
Invitado


Volver arriba Ir abajo

Ver el tema anterior Ver el tema siguiente Volver arriba

- Temas similares

 
Permisos de este foro:
No puedes responder a temas en este foro.