Técnicas de explotación de un Data Warehouse

16 junio, 2010 por Ana Buigues Dejar una respuesta »

La construcción de un data warehouse es un medio, no un fin en sí mismo. El fin es la necesidad de realizar análisis y toma de decisiones a través del uso de esa fuente de datos.

Dependiendo de lo requisitos de análisis que planteé la explotación, podemos hablar de diferentes técnicas:

1. Query & Reporting

Consulta y reporte es el término general para referirse a una técnica de explotación de bases de datos que ofrece a las organizaciones acceso a medida a los datos (query) y capacidades de construcción de informes (reporting) para los usuarios finales. Estos informes incluyen datos de detalle, de gran volumen y con un formato que soporta imágenes, varios tipos de gráficos, tablas, etc, que pueden ser consultados por herramientas de usuario final.

Permite:

  • A los usuarios poco expertos solicitar la ejecución de informes o consultas según unos parámetros determinados.
  • A los usuarios con cierta experiencia hacer consultas más flexibles mediante una aplicación que proporcione una interfaz gráfica de ayuda.
  • A los usuarios altamente experimentados puedan escribir, total o parcialmente la consulta en un lenguaje de interrogación de datos.

2. Análisis multidimensional OLAP

Se define OLAP como la consolidación, visualización y el análisis de datos de acuerdo con múltiples dimensiones. Se puede hablar de OLAP como de una tecnología de explotación de bases de datos que facilita la visualización y el análisis multidimensional de los datos.

El análisis multidimensional consiste en analizar los datos que hacen referencia a hechos desde la perspectiva de sus componentes o dimensiones, abarcando también los diferentes niveles que puedan tener las respectivas dimensiones.

El análisis multidimensional se apoya en una visión conceptual multidimensional (cubo o hipercubo) de los datos para permitir a los sistemas OLAP:

  • Soportar requisitos complejos de análisis.
  • Analizar datos desde diferentes perspectivas (dimensiones)
  • Soportar análisis contra un volumen considerable de datos.

Representación de los datos mediante un cubo OLAP:

3. Data Mining

El término data mining o minería de datos se utiliza para hacer referencia a una técnica de análisis de datos cuyo objetio principal es el descubrimiento de conocimiento que se encuentra en los datos y que no es apreciable de manera directa. La minería de datos supone la búsqueda de similitudes, patrones generales y en general relaciones no obvias en los datos, con el objetivo de transformar la información disponible en conocimiento útil de negocio.

El data mining en vez de basarse en métricas de negocio o en información altamente agregada, explota la información detallada del almacén de datos.

No siempre es necesario disponer de un data warehouse para hacer data mining, pero aporta al data mining una fuente de datos de mayor calidad para poder trabajar.

1 comentario

  1. Aida dice:

    Ieeee xiconaaaa!!! Estava buscant informació sobre el Cub OLAP i m’ha aparegut el teu blog!!! Què fooort!!! xDD Em deixes apunts, fins i tot, en la distància i en el temps!! hahahahahahaha. Tot bé??

    Aida.

Deja un comentario