是的,一个界面上同屎瞎示可视化外格与代码,而且同时通过外格与代码改正数据,这未便是 Python 与 Excel 的联合吗?
项目地址:https://github.com/ricklamers/gridstudio
我们先看看 Grid studio 的效果终究是什么样的。总体而言,我们既可以通过 Python 加载和处理数据,也能通过「Excel」操作数据。
Python 上处理数据比较好了解,外格上处理数据实十分像 Excel,如下所示为写一个乞降公式。
也许我们外格上改了些数据,那么我们也能导入到 NumPy 数组,并做进一步的运算。
为什么要创立这个东西?
作家外示,他创立 Grid studio 重假如用来办理数据科学项目中义务流疏散的题目,这种项目中,他要 R studio、Excel 等众个东西之间换来换去。
为 gazillionth-time 导出 CSV 文献时,假如行数过高,运用顺序窗口就会卡顿。即使是做少许简单的事故,比如读取 JSON 文献,也能把人逼疯。现有的东西无法供应高效义务所需的状况和相关义务流,这也是作家决议构修该东西的启事。他念要创立一个易用的运用顺序,可以把数据科学义务流整合进去。
这个东西有何亮点?
Grid studio 是一个基于网页的运用,看起来和 Google Sheets、Microsoft Excel 差未几。然而,它的杀手锏是整合了 Python 言语。
确实所有运用过盘算机的人都会很自然地运用外格来查看和编辑数据。将这个简单的 UI 与 Python 这种成熟的编扯蒿言联合起来确实不要太好用。
用 Python 编写脚本十分简单:只需编写几行代码直接运转即可。
中心集成:读、写
这一 Python 集成的中心是对电子外格的读写接口,它可以电子外格的数据和 Python 历程中的数据之间修立一个高功用的连接。
可以用以系澜式外格中写入数据:
sheet("A1:A3", [1, 2, 3])
用以下这种方法从外格中读取数据:
my_matrix = sheet("A1:A3")
你可以通过这种简单而高效的方法直接外格中读取或写入数据,以主动化数据输入、提取、可视化等进程。
编写定制化外格函数
虽然通过一个简单的接口完毕读写十分灵敏,但有时编写可以直接调出的定制化函数也很主要。
除了 AVERAGE、SUM、IF 这些默认函数外,你可以还需求其他函数,那么写出来就好了!
def UPPERCASE(a):
return str(a).uppercase()
写完这行代码后,外格中调出该函数,就像调用常规函数相同。
应用 Python 生态
通过应用 Python 生态中种种强大的软件包,我们能立即拜访到目今最优的数据科学东西,于是也能疾速拜访到强大的模子,比如线性回归和 支撑向量机等。
因为本身 Grid studio 主要便是处理外格数据,那么将它们举措特功可以疾速调用 SVM 等模子,从而探究躲藏这些数据背后的特征。
数据可视化
数据科学中,很常睹的一个义务便是可视化数据,如许才干取得关于数据的「先验常识」。通过集成交互式绘图库 Plotly.js 和 Python 标准可视化库 Matplotlib,Grid studio 目前曾经内置了高级绘图功用。如下所示我们可以向量外格样式上运用高级绘图功用:
为了进一步标明怎样运用 Grid studio 的特征以构修可视化图标,项目作家还展现了两个案例,即爬取网页与可视化数据分布,但这里主要展现第一个案例。
案例:估量正态分布
如下案例展现了 Grid studio 的强大功用,它会以更高的保真度通过 Plotly.js 可视化正态分布,我们可以看看交互式制图终究是怎样完毕的。
运用安装
前面先容了这么众特征,那么我们终究该怎样用呢?Grid studio 的安装和运用都十分简单,通过简单的命令行就能搞定。
git clone https://github.com/ricklamers/gridstudio
cd gridstudio && ./run.sh
如上通过下载项目、运转安装脚本两步,我们就能浏览器中翻开当地端口,然后就能速乐地运用了。
参考链接:
https://hackernoon.com/introducing-grid-studio-a-spreadsheet-app-with-python-to-make-data-science-easier-tdup38f7
https://github.com/ricklamers/gridstudio
https://gridstudio.io