Apache Hadoop, büyük ölçekli veri kümelerinin emtia sunucu kümeleri arasında dağıtılmış olarak depolanması ve işlenmesi için kullanılan açık kaynaklı bir yazılım çerçevesidir. Her biri yerel işleme ve depolama sunan tek sunuculardan binlerce makineye kadar ölçeklenecek şekilde tasarlanmıştır. MapReduce programlama modelinin bir uygulamasıdır ve Hadoop verileri dağıtılmış depolamada saklar ve MapReduce hesaplama modeliyle işler.

Hadoop, 2006 yılında Google'ın MapReduce makalesinden esinlenen Doug Cutting ve Mike Cafarella tarafından Yahoo! Başlangıçta, Apache Yazılım Vakfı 2007 yılında projenin yönetimini devraldı. O zamandan bu yana Hadoop büyük ilgi gördü ve şu anda sosyal medya, finans, risk analizi, tıbbi kayıtlar ve daha fazlası dahil olmak üzere birçok alanda yaygın olarak kullanılıyor.

Hadoop'un özünde iki bileşen vardır: dağıtık dosya sistemi ve MapReduce programlama modeli. Hadoop'un dağıtılmış dosya sistemi HDFS, Google Filesystem'i temel alır ve verilerin birden fazla makinede bloklar halinde depolanmasına olanak tanıyarak hataya dayanıklı bir depolama sistemi sağlar. Bu arada, MapReduce programlama modeli bir görevi alt görevlere böler ve bunları birden fazla düğüme dağıtır. Bu, paralelleştirme sağlar ve yüksek hızlı, dağıtılmış bilgi işlem sağlar.

Temel bileşenlere ek olarak Hadoop, ilgili araçlardan oluşan bir kütüphane ile birlikte gelir. Bunlar arasında Hive veritabanı ve analiz motoru, Pig Latin komut dosyası dili, işleri zamanlamak için YARN ve iş akışı yönetimi için Oozie bulunmaktadır. Hadoop ayrıca Java, C++, Python, Ruby ve Perl dahil olmak üzere çok çeşitli geliştirici dillerini de desteklemektedir.

Son yıllarda Hadoop, Büyük Veri çözümlerinin önemli bir bileşeni haline gelmiştir. Büyük hacimli verileri hızlı ve verimli bir şekilde işlemesi gereken işletmeler için ideal bir seçimdir. Ölçeklenebilirliği ve esnekliği onu veri odaklı kuruluşlar için mükemmel bir seçenek haline getirmektedir.

Genel olarak Apache Hadoop, büyük ölçekli veri kümelerinin emtia sunucu kümeleri arasında dağıtılmış olarak depolanması ve işlenmesi için kullanılan açık kaynaklı bir çerçevedir. Kullanımı kolaydır ve verileri işlemek ve depolamak için verimli bir yol sağlar.

Proxy Seçin ve Satın Alın

Veri Merkezi Proxyleri

Dönen Proxyler

UDP Proxyleri

Dünya Çapında 10.000'den Fazla Müşterinin Güvendiği

Vekil Müşteri
Vekil Müşteri
Vekil Müşteri flowch.ai
Vekil Müşteri
Vekil Müşteri
Vekil Müşteri