Data lake je termín používaný k popisu úložiště nebo úložné platformy, obvykle on-premise cloud nebo hybrid, která se používá k ukládání velkého množství nestrukturovaných nebo polostrukturovaných dat. Používá se k ukládání široké škály datových formátů včetně strukturovaných databází, nestrukturovaného textu a sociálních médií, dat ze senzorů internetu věcí a výsledků analýz. Datová jezera jsou navržena tak, aby prováděla operace zpracování dat, analýzy a reportování ve vysoce bezpečném a škálovatelném prostředí.
Datové jezero se liší od tradičnějších databází, jako jsou relační databáze, v tom, že neukládají přísná pravidla pro datové typy nebo strukturu, místo toho umožňují méně organizovaná a složitější data. Díky tomu je ideální platformou pro ukládání a zpracování všech typů dat, včetně těch z více zdrojů. Datová jezera jsou v organizacích stále populárnější, protože jsou schopna zpracovávat velké objemy dat díky své flexibilní struktuře.
Datová jezera jsou přijímána mnoha organizacemi, aby získaly přehled z jejich velkých datových souborů. Datová jezera lze například použít pro zefektivnění uspořádání dat, integraci různých zdrojů dat a další operace, jako je převod dat do společného formátu. Tato technologie dále umožňuje organizacím rychle prozkoumat a získat přehled z dat, která by jinak zůstala nevyužita nebo skryta.
Existuje však několik problémů spojených s datovými jezery, které musí organizace před přijetím zvážit. Tyto problémy zahrnují bezpečnostní hrozby způsobené neoprávněným přístupem k datovému jezeru, problémy s kvalitou nekontrolovaných formátů dat a složitost integrace. Proto je důležité, aby organizace zajistily správné zabezpečení a správu technologií datových jezer.