TITANIDE 云原生开发之旅1 | 使用 Jupyter Notebook 实现数据分析

2022-05-05

123

作者:行云创新 John


TITANIDE 云原生开发之旅正式开启了。

首先,我会聚焦于面向初学者,然后由浅入深,分享我是如何使用 TITANIDE 在线IDE)的云原生开发旅程。

如果是传统的开发,对于一个初学者来说,需要配置开发环境,学习门槛高。我们本次讲解的内容是使用 Jupyter 实现数据分析,那么您需要安装 Python 环境,Jupyter Notebook 及其用到的依赖组件。不过,我们为了聚焦使用 Jupyter 实现数据分析,直接采用在线的 TITANIDE 来实现。


TITANIDE 简介

TITANIDE在线IDE 是采用 B/S 架构设计的云原生集成开发环境,内置了业界主流的IDE,让您能够更快速的启动一个您所熟悉的 IDE,不管您以前是使用 VS Code、WebStorm、Intellij IDEA、Goland、Pycharm,总有一款适合您。您无需搭建开发环境,只需要打开浏览器就能编写并运行、调试您的项目代码,从而聚焦您业务。

TITANIDE 提供了一系列开箱即用的模板,您可以直接通过模板来来开始您的编程之旅。

本文我们使用了 VS Code for Python 模板。



Jupyter 简介

尽管不同领域、不同背景,但是,有一些工具已经成了数据科学领域的标准化工具,例如,Python、Jupyter Notebook。

Jupyter 项目是一个非盈利,100% 开源的项目,您可以使用 Jupyter 来开发支持交互的数据科学、科学软件和网页应用。JupyterLab,Jupyter Notebook, 以及 Jupyter Hub 是由 Jupyter 项目组开发的三个关键的开源软件项目

Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。它的用途包括:数据清理和转换、数值模拟、统计建模、数据可视化、机器学习等等。

它具有以下优势:

•可选择语言:支持超过40种编程语言,包括 Python、R、Scala 等。

•分享笔记本:可以使用电子邮件、GitHub 和 Jupyter Notebook Viewer 与他人共享。

•交互式输出:代码可以生成丰富的交互式输出,包括HTML、图像、视频、LaTeX 等。

•大数据整合:通过 Python、R、Scala 编程语言使用 Apache Spark 等大数据框架工具。支持使用 pandas、scikit-learn、ggplot2、TensorFlow 来探索同一份数据。



操作步骤


创建新的 Jupyter Notebook

Mac 用户通过快捷键 Command + Shift + P 打开命令操作面板;Windows 用户通过快捷键 Ctrl + Shift + P 打开命令操作面板。创建新的 Jupyter Notebook。



Jupyter 代码单元格

在这个 Notebook 中,你将体验操作代码单元格。

首先,运行以下代码单元格。就像之前我所提到的,你可以通过选中并点击运行(run cell)按钮来运行代码单元格。另外,你也可以通过快捷键 Shift + Enter 来运行。使用快捷键的好处是你的双手不需要离开键盘。

单元格中的代码运行的结果将会显现在单元格下方。它和正常的 Python shell 一样打印出代码的运行结果,但是只会打印最后一个运行结果。如果你想打印所有结果,你需要使用 print() 。



在 Jupyter 代码单元格编写代码,在这里,我们将输出一个正玄波。第一次运行会提升模组未安装的错误信息:


import numpy as np

import matplotlib.pyplot as plt


x = np.linspace(0, 20, 100)

plt.plot(x, np.sin(x))

plt.ylabel('sin')

plt.show()



安装依赖组件

安装以下两个模组

# 如果安装速度慢,请确认使用合适的 pip 源

export PIP_EXTRA_INDEX_URL=https://pypi.tuna.tsinghua.edu.cn/simple


# 安装依赖

pip install matplotlib

pip install pandas



调试运行

在TITANIDE在线IDE Python 交互式窗口中,可以查看、检查及过滤当前 Jupyter 会话中的变量。通过在运行代码和单元格后展开变量”

部分,您将看到当前变量的列表,这些变量将在代码中使用变量时自动更新。单击每个列标题将允许您对表中的变量进行排序。

有关变量的其他信息,还可以双击行或使用数据查看器中的显示变量按钮在数据查看器中查看变量的更详细视图。打开后,您可以通过搜索行来过滤值。



总结

通过本文提到的方法,您可以在 15 分钟内快速的通过 TITANIDE 在线IDE提供的开箱即用的 Python 模板,创建 Jupyter Notebook 实现数据分析。


----------------------------

TITANIDE,云原生集成开发环境

免费体验地址>

技术交流
我们建了一个云原生技术交流群,里面有来自Oracle、Citrix、华为、腾讯等国内外云计算专家,立即扫码,拉你进群。目前已有1000+开发者加入我们......
在云原生时代,行云创新致力于通过赋能开发者,实现企业快速迭代与交付,大幅提升创新效率。
免费试用