Apache Zeppelin
Apache Zeppelin — многопользовательское интерактивное браузерное программное средство (интерактивный блокнот) для анализа и визуализации данных, а также совместной работы над данными с использованием средств Apache Spark; позиционируется как аналог Jupyter для экосистемы Hadoop[5]. Интерактивные браузерные блокноты позволяют инженерам данных, аналитикам и ученым в области данных более продуктивно выполнять работу, благодаря совместному использованию кода данных, его разработке, организации и выполнению, а также благодаря визуализации результатов без необходимости обращения к командной строке или к компонентам кластера. Разрабатывается под эгидой фонда Apache с 2015 года, входит в ряд дистрибутивов Hadoop, предоставляется в облаке Amazon Web Services в составе модуля Elastic MapReduce[6]. ИсторияПроект был создан в 2013 году компанией NFLabs в Южной Корее. В 2014 году исходный код был передан в фонд Apache Software Foundation. В 2016 году Apache Zeppelin получил статус верхнеуровневого проекта фонда Apache.[7][8] ФункциональностьApache Zeppelin поддерживает систему «интерпретаторов» (плагинов), которые позволяют подключаться к источникам данных и выполнять анализ. Среди поддерживаемых интерпретаторов — Apache Spark, JDBC, Markdown, Shell и другие.[9][10][11] Сравнение с аналогамиApache Zeppelin часто сравнивают с Jupyter Notebook. Главное отличие заключается в ориентации Zeppelin на распределённые вычислительные среды, такие как Hadoop и Spark, что делает его удобным инструментом для анализа больших объёмов данных. В то время как Jupyter изначально проектировался в первую очередь для локальной работы. Примечания
Ссылки |