miércoles, 18 de enero de 2012

DataMart


Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de información.

Un Data mart es una versión especial de almacén de datos (data warehouse). Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de múltiples formas para que diversos grupos de usuarios realicen la explotación de los mismos de la forma más conveniente según sus necesidades.

El Data mart es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos (altas) con una frecuencia baja y conocida. Es consultado mediante herramientas OLAP (On line Analytical Processing - Procesamiento Analítico en Línea) que ofrecen una visión multidimensional de la información. Sobre estas bases de datos se pueden construir EIS (Executive Information Systems, Sistemas de Información para Directivos) y DSS (Decision Support Systems, Sistemas de Ayuda a la toma de Decisiones). Por otra parte, se conoce como Data Mining al proceso no trivial de análisis de grandes cantidades de datos con el objetivo de extraer información útil, por ejemplo para realizar clasificaciones o predicciones.

En síntesis, se puede decir que los data marts son pequeños data warehouse centrados en un tema o un área de negocio específico dentro de una organización.

Razones para crear un data mart

Fácil acceso a los datos que se necesitan frecuentemente.
Crea vista colectiva para grupo de usuarios.
Mejora el tiempo de respuesta del usuario final.
Facilidad de creación.
Costo inferior al de la aplicación de un completo almacén de datos.
Los usuarios potenciales son más claramente identificables que en un almacén de datos completo.

Data Mart: el hermano menor de Data Warehouse

A pesar de las grandes ventajas de Data Warehouse, parecen existir unas importantes barreras para su utilización en empresas de tamaño mediano. Los productos Data Warehouse han nacido para resolver problemas de análisis de grandes masas de información, en empresas donde una pequeña diferencia en el valor de una variable, puede afectar la cuenta de resultado con unas diferencias de millones de dólares.

Los productos y proyectos Data Warehouse están dimensionados para este tipo de empresas, contando con hardware muy potente (muchas veces especializado) y la masiva intervención de consultores externos, expertos en la realización de la puesta en marcha. Un proyecto de este tipo resulta en todos los aspectos excesivo para un departamento de ventas que necesita analizar la información de 500.000 - 3.000.000 de líneas de pedidos, o una cantidad equivalente de información financiera, que es lo normal para una empresa mediana.

Para resolver este tipo de necesidades han surgido los Data Mart, productos que utilizan la tecnología Data Warehouse adaptada a las necesidades de las empresas medias. Data Mart se destaca por una definición de requerimientos más fácil y rápida. También se simplifica el desarrollo de todo el mecanismo de su base de datos y con ello baja substancialmente todo el coste del proyecto, así como su duración. Normalmente, Data Mart resuelve aplicaciones a nivel departamental, aunque en ocasiones se desarrolla una aplicación que integre todas ellas y proporciona las funciones de un EIS.

Los esfuerzos de los desarrolladores de productos Data Mart, junto con los mejoras del índice precio/rendimiento del hardware, suben constantemente el límite de penetración de Data Mart, permitiendo asumir proyectos más y más importantes. La simplicidad de los proyectos de Data Mart y el menor coste en comparación con Data Warehouse, significan una ventaja competitiva muy grande a favor de Data Mart, donde el mercado de los dos tipos de productos se solapa.

Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creación, explotación y mantenimiento de los cubos OLAP es muy heterogéneo, en función de la herramienta final que se utilice.

Datamart OLTP

Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa. Las estructuras más comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque sólo es posibles en algunos SGBD avanzados, como Oracle).

Los datamarts que están dotados con estas estructuras óptimas de análisis presentan las siguientes ventajas:

* Poco volumen de datos

* Mayor rapidez de consulta

* Consultas SQL y/o MDX sencillas

* Validación directa de la información

* Facilidad para la historización de los datos

Data Warehouse

Desde que se inició la era de la computadora, las organizaciones han usado los datos desde sus sistemas operacionales para atender sus necesidades de información. Algunas proporcionan acceso directo a la información contenida dentro de las aplicaciones operacionales. Otras, han extraído los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de información.

Ambos métodos han evolucionado a través del tiempo y ahora las organizaciones manejan una data no limpia e inconsistente, sobre las cuales, en la mayoría de las veces, se toman decisiones importantes.

La gestión administrativa reconoce que una manera de elevar su eficiencia está en hacer el mejor uso de los recursos de información que ya existen dentro de la organización. Sin embargo, a pesar de que ésto se viene intentando desde hace muchos años, no se tiene todavía un uso efectivo de los mismos.

La razón principal es la manera en que han evolucionado las computadoras, basadas en las tecnologías de información y sistemas. La mayoría de las organizaciones hacen lo posible por conseguir buena información, pero el logro de ese objetivo depende fundamentalmente de su arquitectura actual, tanto de hardware como de software.

El data warehouse, es actualmente, el centro de atención de las grandes instituciones, porque provee un ambiente para que las organizaciones hagan un mejor uso de la información que está siendo administrada por diversas aplicaciones operacionales.

Un data warehouse es una colección de datos en la cual se encuentra integrada la información de la Institución y que se usa como soporte para el proceso de toma de decisiones gerenciales. Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un Warehouse, la experiencia ha demostrado que existen muchas dificultades potenciales.

Reunir los elementos de datos apropiados desde diversas fuentes de aplicación en un ambiente integral centralizado, simplifica el problema de acceso a la información y en consecuencia, acelera el proceso de análisis, consultas y el menor tiempo de uso de la información.

Las aplicaciones para soporte de decisiones basadas en un data warehousing, pueden hacer más práctica y fácil la explotación de datos para una mayor eficacia del negocio, que no se logra cuando se usan sólo los datos que provienen de las aplicaciones operacionales (que ayudan en la operación de la empresa en sus operaciones cotidianas), en los que la información se obtiene realizando procesos independientes y muchas veces complejos.

Un data warehouse se crea al extraer datos desde una o más bases de datos de aplicaciones operacionales. La data extraída es transformada para eliminar inconsistencias y resumir si es necesario y luego, cargadas en el data warehouse. El proceso de transformar, crear el detalle de tiempo variante, resumir y combinar los extractos de datos, ayudan a crear el ambiente para el acceso a la información Institucional. Este nuevo enfoque ayuda a las personas individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con más responsabilidad.

La innovación de la Tecnología de Información dentro de un ambiente data warehousing, puede permitir a cualquier organización hacer un uso más óptimo de los datos, como un ingrediente clave para un proceso de toma de decisiones más efectivo. Las organizaciones tienen que aprovechar sus recursos de información para crear la información de la operación del negocio, pero deben considerarse las estrategias tecnológicas necesarias para la implementación de una arquitectura completa de data warehouse.

¿Que es el Data WareHousing?

Data warehousing es el centro de la arquitectura para los sistemas de información en la década de los '90. Soporta el procesamiento informático al proveer una plataforma sólida, a partir de los datos históricos para hacer el análisis. Facilita la integración de sistemas de aplicación no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.

Un Data Warehouse o Depósito de Datos es una colección de datos orientado a temas, integrado, no volátil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales.

Se puede caracterizar un data warehouse haciendo un contraste de cómo los datos de un negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las aplicaciones de producción.



CARACTERISTICAS DE UN DATA WAREHOUSE

Entre las principales se tiene:

· Orientado al tema

· Integrado

· De tiempo variante

· No volátil

ESTRUCTURA DE UN DATA WAREHOUSE

Los data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematización y detalle que delimitan el data warehouse. La estructura de un data warehouse se muestra en la Figura N° 5.

En la figura, se muestran los diferentes componentes del data warehouse y son:

· Detalle de datos actuales

· Detalle de datos antiguos

· Datos ligeramente resumidos

· Datos completamente resumidos

· Meta data

Detalle de datos actuales.- En gran parte, el interés más importante radica en el detalle de los datos actuales, debido a que:

Refleja las ocurrencias más recientes, las cuales son de gran interés

Es voluminoso, ya que se almacena al más bajo nivel de granularidad.

Casi siempre se almacena en disco, el cual es de fácil acceso, aunque su administración sea costosa y compleja.

Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. Mientras no sea prioritario el almacenamiento en un medio de almacenaje alterno, a causa del gran volumen de datos unido al acceso no frecuente de los mismos, es poco usual utilizar el disco como medio de almacenamiento.

Datos ligeramente resumidos.- La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son:

Que la unidad de tiempo se encuentre sobre la esquematización hecha.

Qué contenidos (atributos) tendrá la data ligeramente resumida.

Datos completamente resumidos.- El siguiente nivel de datos encontrado en el data warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles.

Metadata.- El componente final del data warehouse es el de la metadata. De muchas maneras la metadata se sitúa en una dimensión diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.

La metadata juega un rol especial y muy importante en el data warehouse y es usada como:

Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.

Una guía para el mapping de datos de cómo se transforma, del ambiente operacional al de data warehouse.

Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.

La metadata juega un papel mucho más importante en un ambiente data warehousing que en un operacional clásico.

A fin de recordar los diferentes niveles de los datos encontrados en el data warehouse, considere el ejemplo mostrado en la Figura N° 6.

El detalle de ventas antiguas son las que se encuentran antes de 1992. Todos los detalles de ventas desde 1982 (o cuando el diseñador inició la colección de los archivos) son almacenados en el nivel de detalle de datos más antiguo.

El detalle actual contiene información desde 1992 a 1993 (suponiendo que 1993 es el año actual). En general, el detalle de ventas no se ubica en el nivel de detalle actual hasta que haya pasado, por lo menos, veinticuatro horas desde que la información de ventas llegue a estar disponible en el ambiente operacional.

El Modelo Multidimensional



Los datos en un DW se modelan en data cubes (“cubos de datos” sería su
traducción literal), estructuras multidimensionales (hipercubos, en concreto)
cuyas operaciones más comunes son:
. Roll up (incremento en el nivel de agregación de los datos).
. Drill down (incremento en el nivel de detalle, opuesto a roll up).
. Slice (reducción de la dimensionalidad de los datos mediante selección).
. Dice (reducción de la dimensionalidad de los datos mediante proyeccción).
. Pivotaje o rotación (reorientación de la visión multidimensional de los datos).

Modelado Multidimensional:

Modelos de datos como conjuntos de medidas descritas por dimensiones.
• Adecuado para resumir y organizar datos (p.ej. hojas de cálculo).
• Enfocado para trabajar sobre datos de tipo numérico.
• Más simple: Más fácil de visualizar y entender que el modelado E/R.

Dimensiones

Perspectivas o entidades respecto a las cuales una organización quiere mantener
sus datos organizados (p.ej. tiempo, localización, clientes, proveedores…)
Miembros
Nombres o identificadores que marcan una posición dentro de la dimensión.
Ejemplos:
Meses, trimestres y años son miembros de la dimensión tiempo.
Ciudades, regiones y países son miembros de la dimensión localización.
Jerarquías
Los miembros de las dimensiones se suelen organizar en forma de jerarquías.

Hechos
Colecciones de datos relacionados compuestas por medidas y un contexto.
• Las dimensiones determinan el contexto de los hechos.
• Cada hecho particular está asociado a un miembro de cada dimensión.
Medidas
Atributos numéricos asociados a los hechos (lo que realmente se mide).
Ejemplos: Volumen de las ventas, coste asociado a un producto, número
de transacciones efectuadas, porcentaje de beneficios.

Características del Modelo Multidimensional

En general, la estructura básica de un DW para el Modelo Multidimensional está definida por dos
elementos: esquemas y tablas.
Tablas DW: como cualquier base de datos relacional, un DW se compone de tablas. Hay dos tipos
básicos de tablas en el Modelo Multidimensional:
Tablas Fact : contienen los valores de las medidas de negocios, por ejemplo: ventas promedio endólares, n úmero de unidades vendidas, etc.
Tablas Lock_up: contienen el detalle de los valores que se encuentran asociados a la tabla Fact.
Esquemas DW: la colección de tablas en el DW se conoce como Esquema. Los esquemas caen dentro de dos categorías básicas: esquemas estrellas y esquemas snowflake.

Procesos de Negocio

Hoy en día, la tecnología es un factor crítico en el éxito o fracaso de un negocio. Compañías que incorporan nuevo software y sistemas exitosamente en su infraestructura de información se posicionan para lograr ventajas competitivas sostenidas.

En el ámbito de negocios de hoy, eso significa implementar sistemas que proveen operaciones simplificadas y de bajo costo. Otras capacidades críticas, incluyen la habilidad de comunicar información a tiempo y certeramente a la creciente fuerza de trabajo ambulante, mejorando continuamente la productividad del empleado y la capacidad de proteger la integridad de los sistemas y la propiedad intelectual.

A medida que los gerentes de negocio crecen en número en busca de una reingeniería en los procesos de negocio (Business Process Reenginering) como una medida de aplicar las Tecnologías de Información a sus negocios, crece también la creencia de que una mejora en los procesos la cual incluye algún componente de TI, permitirá darle a la compañía ventajas competitivas además de proveer de productos de calidad y servicios a sus clientes.

Alineando primeramente una compañía a sus estrategias en sus procesos de negocio, en busca de mejorar la eficiencia a través de la gestión sistemática de éstos (BPR), mediante el modelar, automatizar, integrar, monitorizar y optimizar de forma contínua, creará el entorno perfecto para entonces, aplicar las tecnologías de información actualizadas y acorde a las necesidades, para automatizar estas tareas.

De ninguna manera podemos pensar implementar en un primer plano, una tecnología de información, sin antes saber perfectamente , cuales son los procesos de negocio que afectan a una empresa en sus personas, políticas, procedimientos, producción y producto, de lo contrario, estaríamos cayendo en el error de alinear la empresa a la tecnología y no las tecnologías a los procesos clave de negocio.



¿Que son los Procesos de Negocio?

Thompson, R.J y Redstone, L (1997) definen un proceso como una serie de actividades interconectadas en busca de un propósito. En un contexto de negocios, el propósito de los procesos será proveer a sus clientes internos con sus requerimientos de una manera oportuna.

Las entradas y salidas de un proceso normalmente son bastante directas en identificar. Las entradas son aquello necesario en un proceso como “materia prima”, o en el caso de que el proceso sea un servicio, el detonante que inicia el proceso siguiente. Las salidas son el producto o servicio que los procesos producen. Los controles y recursos son un poco mas complicados, ya que varían según el tipo del ambiente de negocio.

Un proceso de negocio es un completo y dinámicamente coordinado conjunto de actividades transaccionales y de colaboración que entrega valor a los clientes o se encarga de cumplir otras metas estratégicas de la compañía (Christoph F Strnadl, 2006).

A medida que los gerentes de negocio crecen en número en busca de una reingeniería (Business Process Reenginering) como una medida de aplicar las Tecnologías de Información a sus negocios, crece también la creencia de que una mejora en los procesos la cual incluye algún componente de TI permitirá darle a la compañía ventajas competitivas además de proveer de productos de calidad y servicios a sus clientes (Vishanth Weerakkody, C. Matthew Hinton, 1999).

Conclusiones:

Definitivamente las tecnologías de información juegan un papel cada vez más importante en facilitar la introducción de productos nuevos o de servicios, en mejorar procesos operacionales, y en la guía de la toma de decisión directiva.

Todos los negocios se transforman por el uso de la tecnología, y la competitividad que pueda generar dicho ajuste dependerá del nivel de conexión o alineación entre la tecnología y los requerimientos reales del negocio; es decir, del nivel de asociación de la tecnología con un planteamiento de cambio.

De ahí la importancia que tiene el establecer los procesos de negocio que determinarán la manera en que la empresa opera, de otro modo, sólo se hace más complejo el panorama al tratar de implementar primeramente una tecnología de información, y después definir los procesos de la empresa. Esto solamente derivaría altos costos en inversión de tecnologías de información.

Como sabemos, las tecnologías de información no determinan los procesos de negocio de una compañía, son habilitadores para eficientizar la manera en que estos se llevarán a cabo.
Las organizaciones se apoyan en sus procesos de negocios para ser guiados en este complejo escenario. No obstante, en muchas organizaciones, dada la complejidad del mismo, existe una importante diferencia entre los procesos que deberían estar implantados y los procesos que se encuentran operando el negocio en realidad.

El enlace entre procesos de negocio y generación de valor lleva a algunos practicantes a ver los procesos de negocio como los flujos de trabajo que se efectúan las tareas de una organización. Los procesos de negocio pueden ser vistos como un recetario para hacer funcionar un negocio y alcanzar las metas definidas en la estrategia de negocio de la empresa.

Para que nuestro análisis de procesos tenga éxito, debe contener toda una estructura realista de lo que sucede realmente en los procesos, para determinar las oportunidades que tiene la empresa por mejorar, y emprender la mejor alineación hacia la cadena de valor posible.

Cuando logremos alinear estos procesos de negocio a la meta, es cuando podemos hablar de la capacidad de una compañía de continuamente rediseñar su cadena de valor y modificar sus activos humanos, estructurales, financieros y tecnológicos, para lograr una ventaja competitiva respecto a sus competidores, que es realmente ésta la mayor razón por la que un proceso de negocio se vuelve la parte mas fundamental en la que se basa una compañía.

De nada nos servirá la administración computarizada de una empresa mediante las tecnologías de información, si antes no tenemos bien definidos correctamente los procesos de negocio, en los cuales la compañía sustenta su correcto funcionamiento.

Inteligencia de Negocios



En estos últimos años cada vez existen más estudios orientados a analizar la información como factor clave para la toma de decisiones en la empresa, clave de la gestión empresarial, y eje conceptual sobre el que gravitan los sistemas de información empresariales.La información es considerada como un recurso que se encuentra al mismo nivel que los recursos humanos, financieros y materiales, que anteriormente habían constituido los únicos ejes sobre los que había girado la gestión empresarial. Si la Teoría económica tradicional mantenía: al capital, la tierra y el trabajo como elementos primarios de estudio, la información es, ahora, el cuarto recurso fundamental en la gestión y mejora sostenida de las Organizaciones.

Que es la Inteligencia de Negocios?

Es una arquitectura y colección de herramientas que buscan mejorar a las organizaciones, proporcionando vistas de aspectos de negocio a todos los empleados (estratégico, táctico, operacional) para que tomen mejores y más relevantes decisiones en menos tiempo y con la mayor información posible, brindando:

· Información correcta
· Tiempo oportuno
· Personas Correctas

Constituye una arquitectura y colección de aplicaciones operacionales y de soporte de decisiones con bases de datos que proporcionan a los usuarios de la organización fácil acceso a la data del negocio. La Inteligencia de Negocios se direcciona principalmente en Aplicaciones y Base de Datos de Soporte a la Toma de Decisiones correctas.

Business Intelligence (Inteligencia de Negocios) es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.




Podremos:
.Generar reportes globales o por secciones
.Crear una base de datos de clientes
.Crear escenarios con respecto a una decisión
.Hacer pronósticos de ventas y devoluciones
.Compartir información entre departamentos
.Análisis multidimensionales
.Generar y procesar datos
.Cambiar la estructura de toma de decisiones
.Mejorar el servicio al cliente

Los principales productos de Business Intelligence que existen hoy en día son:

* Cuadros de Mando Integrales (CMI)

* Sistemas de Soporte a la Decisión (DSS)

* Sistemas de Información Ejecutiva (EIS)

Por otro lado, los principales componentes de orígenes de datos en el Business Intelligence que existen en la actualidad son:

* Datamart

* Datawarehouse