Apache Flink
FiturBeberapa fitur utama Flink meliputi:
SejarahApache Flink berasal dari proyek penelitian akademik. Pada tahun 2010, proyek Stratosphere dimulai oleh lima kelompok penelitian dari Technische Universität Berlin, Humboldt Universität zu Berlin, dan Hasso Plattner Institute Potsdam. Tujuan utama proyek ini adalah mengembangkan pendekatan baru untuk pemrosesan data terdistribusi dalam skala besar. Sebagai bagian dari proyek ini, para peneliti mengembangkan prototipe sistem pemrosesan data untuk mengevaluasi pendekatan baru mereka. Perangkat lunak ini kemudian dirilis sebagai aplikasi terbuka (open-source) di bawah lisensi perangkat lunak Apache. Pada tahun yang sama, proyek Apache Hadoop (dari sebuah implementasi aplikasi terbuka (open-source) dari Google MapReduce dan Google File System (GFS)) yang menjadi sangat populer di kalangan industri dan akademisi. Keunggulan utama Hadoop adalah kemampuannya untuk menskalakan tugas pemrosesan data ke banyak mesin dengan spesifikasi standar serta toleransi tinggi terhadap kegagalan perangkat keras dan perangkat lunak. Namun, komunitas penelitian basis data menyadari bahwa MapReduce tidak cukup efisien atau mudah digunakan dalam mendefinisikan aplikasi analitik yang kompleks. Oleh karena itu, proyek Stratosphere bertujuan untuk menggabungkan keunggulan MapReduce dengan sistem basis data relasional. Proyek ini menghasilkan sistem pemrosesan data terdistribusi yang terdiri dari:
Pendekatan ini membuat spesifikasi aplikasi analitik yang kompleks menjadi lebih mudah. Operator runtime yang digunakan untuk menjalankan program PACT diimplementasikan berdasarkan algoritma terkenal dalam sistem basis data, seperti:
Pendekatan ini memungkinkan sistem untuk menangani pemrosesan data dengan efisiensi yang lebih tinggi dibandingkan dengan MapReduce. Referensi
|