Month: August 2014

Hadoop Itu Apaan Sih?

Posted on Updated on

Updated – Saya punya tentang introduction to big data technology khusus-nya tentang hadoop yang saya publish di Slideshare.

Sebenernya udah lumayan lama gue sempet baca beberapa artikel tentang Hadoop semenjak beberapa tahun lalu, tapi ngga pernah bener2 nyoba. Nahh.. akhirnya nih pada hari ini gue mulai nyentuh dan beneran belajar yang namanya Hadoop.¬†Mudah2an gue bisa ngerti dan paham nih sama teknologi yg satu ini, karena cukup menjanjikan banget fungsinya ūüėČ

Apaan sih Hadoop?

(Menurut Wikipedia)

Apache Hadoop is an open-source software framework for distributed storage and distributed processing of Big Data on clusters of commodity hardware. Its Hadoop Distributed File System (HDFS) splits files into large blocks (default 64MB or 128MB) and distributes the blocks amongst the nodes in the cluster. For processing the data, the Hadoop Map/Reduce ships code (specifically Jar files) to the nodes that have the required data, and the nodes then process the data in parallel. This approach takes advantage of data locality,[3] in contrast to conventional HPC architecture which usually relies on a parallel file system (compute and data separated, but connected with high-speed networking).[4]

Terus kalau yang¬†saat ini gue tau, hadoop juga ada ‘custom’ distribution nya kayak mysql gitu. ada yg vanila hadoop ada juga yg di merk-in sama beberapa company. contoh nya 2 vendor hadoop gratis yang lumayan terkenal adalah Cloudera dan Hortonworks.

Jadi kalau misalkan lu punya data yang super gede banget dan server database lu udah ga mampu untuk mem-proses data tersebut, nah mungkin udah saatnya lu mulai belajar hadoop juga deh bro.. Nanti kalau gue udah punya hands-on experience tentang hadoop, gue bakalan posting lagi yak!