Un almacén de datos es una colección de datos integrados procedentes de diversas fuentes, almacenados y mantenidos en una estructura de datos que facilita su uso y la elaboración de informes. Los almacenes de datos suelen contener datos históricos derivados de datos de transacciones, como los sistemas de ventas y distribución. Los datos se transforman, limpian e integran en un repositorio único y centralizado.
Los almacenes de datos ponen los datos a disposición de los usuarios para el análisis y la toma de decisiones. Los sistemas de almacén de datos están pensados para apoyar las tareas de inteligencia empresarial, como el procesamiento analítico en línea, la minería de datos y los lenguajes de consulta de apoyo a la toma de decisiones.
Los almacenes de datos se utilizan para combinar datos de fuentes dispares y dividirlos en trozos más pequeños para facilitar la accesibilidad y el análisis. Los datos se almacenan en un formato optimizado para la consulta y la elaboración de informes. El almacén de datos contiene "cubos" que son análogos a las matrices multidimensionales y pueden consultarse con lenguajes como SQL.
Los almacenes de datos pueden ejecutarse en muchas plataformas diferentes, incluidas las bases de datos relacionales tradicionales, los sistemas distribuidos como Hadoop y las bases de datos columnares como Vertica. El diseño de un almacén de datos requiere una planificación cuidadosa, ya que se trata de sistemas grandes y complejos cuyo desarrollo requiere una cantidad de tiempo considerable.
Un almacén de datos suele actualizarse periódicamente con nuevos datos, ya que a menudo se utiliza para rastrear y analizar acontecimientos pasados. Los almacenes de datos pueden utilizarse para mejorar el rendimiento de la organización, identificar nuevos mercados u oportunidades de productos y explorar los comportamientos de los clientes.
Los almacenes de datos no se limitan sólo a las empresas; también los utilizan una amplia gama de organizaciones, como instituciones financieras, organizaciones gubernamentales y organizaciones sanitarias.