MapReduce

MapReduce je programovací model používaný pro distribuované výpočetní úlohy. Je založen na přístupu rozděl a panuj k řešení složitých výpočetních problémů jejich rozdělením na menší, lépe zvládnutelné části. Model MapReduce se primárně používá na velkých souborech dat a obvykle se spoléhá na cluster komoditních serverů pro výpočetní výkon.

MapReduce byl poprvé představen výzkumníky Google v roce 2004 a od té doby se stal oblíbeným nástrojem pro analýzu a zpracování dat. V tomto modelu existují dvě odlišné fáze – fáze mapy a fáze redukce.

Ve fázi mapy jsou data rozdělena do částí nazývaných „rozdělení“. Každé rozdělení je přiřazeno mapovači, který zpracovává data a vydává sadu párů klíč–hodnota. Páry klíč–hodnota jsou pak přiváděny do fáze redukce, kde jsou tříděny a agregovány do jediného výstupu.

Model MapReduce je výhodný pro mnoho úkolů, včetně dolování dat, strojového učení a zpracování přirozeného jazyka. Nejčastěji se používá k analýze velkého množství dat, jako jsou webové protokoly a protokoly serveru, ak rychlému zpracování velkých souborů dat.

MapReduce byl integrován do mnoha oblíbených programovacích jazyků, jako je Java, Python a C#, a je podporován několika populárními platformami, jako je Hadoop a Apache Spark. V důsledku toho se stal běžným nástrojem pro zpracování a analýzu dat a je používán širokou škálou organizací, aby jim pomohl odvodit hodnotu z velkých souborů dat.

Poslední příspěvky

Vyberte a kupte proxy

Proxy datových center

Rotující proxy

UDP proxy

Nejlepší umístění proxy

USA

Velká Británie

Německo

Čína

Austrálie

Kanada

Rusko

Ukrajina

Francie

krocan

Indie

Španělsko

Důvěřuje více než 10 000 zákazníkům po celém světě

Všechny země

Smíšené země