【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析Zeppelin简介环境安装快速开始Kotlin 开发者社区
时间:2022-03-29 01:51
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析
如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark-SQL呢? 如果还可以把这些代码保存起来,并形成文档,支持Markdown语法,如何? 如果还可以将SQL的结果在Web界面上可视化出来呢? 如果还支持R语言,还支持Kylin呢?还支持Angular呢?还支持PostgreSQL呢?不信你不心动。
Zeppelin简介
Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。
Core feature:
-
Web based notebook style editor.
-
Built-in Apache Spark support
To know more about Zeppelin, visit our web site
[ ](
architect%2Fzeppelin%23getting-started)
Zeppelin提供数据可视化的框架。
多用途笔记本
可实现你所需要的:
-
数据采集
-
数据发现
-
数据分析
-
数据可视化和协作
支持多种语言,默认是scala(背后是 shell),SparkSQL, Markdown 和 Shell。可以添加自己的语言支持。
Apache Spark 集成
Zeppelin 提供了内置的 集成。你不需要单独构建一个模块、插件或者库。 Zeppelin的Spark集成提供了:
-
自动引入SparkContext 和 SQLContext
-
从本地文件系统或maven库载入运行时依赖的jar包。
-
可取消job 和 展示job进度
环境安装
下载:
快速开始
Starting Apache Zeppelin
[
]( apache-zeppelin-from-the-command-line) Starting Apache Zeppelin from the Command Line
On all unix like platforms:
bin/zeppelin-daemon.sh start
If you are on Windows:
bin\zeppelin.cmd
After Zeppelin has started successfully, go to with your web browser.
[
]( zeppelin) Stopping Zeppelin
bin/zeppelin-daemon.sh stop
Kotlin 开发者社区
国内第一Kotlin 开发者社区公众号,主要分享、交流 Kotlin 编程语言、Spring Boot、Android、React.js/Node.js、函数式编程、编程思想等相关主题。
越是喧嚣的世界,越需要宁静的思考。