这两天刚好在调程序中,无意中用到了Google Monica,真的让人惊叹不已!
先给结论:编写、调优程序,解释运行结果基本无障碍!
Colab + Monica的流畅和无缝程度,应该远超当时我发过的一篇基于Colab + ChatGPT文章中的效果《GoogleColab + ChatGPT 堪称一站式科研提速神器(堪称代码语法苦恼者的福音)!》。
最关键的是,它是免费的!
这里就不对安装和基本的操作展开聊了,大家可自行去下载安装,我们直接进入主题,看看在Google Colab下用Monica会有怎样的神奇效果!
Google Colab + Monica环境准备
这是Google Colab当前的主页面,经过一段漫长的过程,数据已经完成了pre-processing,接下来基本上可以对已经预处理的数据,用一些常规的算法进行transform。
Monica安装完成后,在侧面会有一个Monica的小浮标
点击之后会出现如下对话框,它支持聊天、写作和备忘,并且支持GPT3.5 Turbo, GPT4, 艺术设计和团队支持!
这些功能,大家可以自行探索,这篇文章主要聚焦Google Colab + Monica中的一些代码操作。
1. 生成代码的能力如何?
为了简单起见,我直接用中文提出一个问题:
“我有一个已经经过预处理的数据集,并且通过df读取了,请写一段代码来对该数据进行PCA,并通过图像展示出来,需要注意的是不同类的instance展示不同的颜色。”
Monica的回答“好的,以下是一段Python代码,可以使用PCA对数据进行降维,并通过图像展示出来,不同类的instance会用不同的颜色表示:”
“其中,your_dataset.csv是你的数据集文件名,label是数据集中的标签列名。你需要将这些变量替换成你自己的变量名。n_components可以设置为你想要的主成分数量。在这个例子中,我们选择了2个主成分,因为我们想要将数据可视化成2D图像。colors和labels分别表示每个类别对应的颜色和标签。”
直接将代码Copy/Paste至Colab的代码框中,并按照它的提示,将数据集名称和标签名修改。
直接运行代码,结果如下:
从结果可以看出,经过PCA之后的数据集分布情况,由于该数据集分类实际上只有两类,所以结果只有红色和绿色,并没有蓝色的数据点。
代码生成能力没问题!
2. 能否基于生成的代码进行优化?
考虑到PCA只设置了两个维度,从图上的结果看,两类数据点的分布并不非常明显,那么我们再增加一个维度,来看看能否找到这两类数据点更为合理的界限。
所以,提出相应问题如下:
直接将代码Copy/Paste至Colab的代码框中,并按照它的提示,将数据集名称和标签名修改:
直接运行代码,结果如下:
我们通过提问,进一步将图像结果进行优化:
“能否将三维图的背景改为黑色,并且将尺寸放大2倍?”
“是的,可以通过设置坐标系的属性来将三维图的背景改为黑色,并且可以通过设置figsize参数来将图像尺寸放大2倍。以下是修改后的代码:”
直接将代码Copy/Paste至Colab的代码框中,并按照它的提示,将数据集名称和标签名修改:
直接运行代码,结果如下:
以上,你可以根据自己的需求,进一步对结果进行优化。
3. 解释运行结果的能力如何?
下面是一段通过各种机器学习算法,比如Decision Tree、Logistic Regression, Random Forest,Xgboost等算法对数据进行运算后的性能结果:
选择这些结果,Monica便自动将内容copy/paste至右侧对话框中,并提示我们希望对该文本进行什么操作~
选择摘要:
“您希望对文本进行什么操作?”
“用原文语言概括这段文字。”
Monica直接给出了摘要结论:这段文字是对四个不同分类器(决策树、逻辑回归、朴素贝叶斯和KNN)在一个数据集上进行性能比较的结果。每个分类器都包括交叉验证得分、分类报告、混淆矩阵、准确率、误报率、训练时间、预测时间和CPU和内存使用情况等指标。其中,决策树和逻辑回归的表现相似且较好,而朴素贝叶斯的表现相对较差。
我们进一步看Monica能否对结果进行讨论:
“能否对上述结果进行深入的讨论?”
“可以,以下是对这些结果的深入讨论:
决策树和逻辑回归的性能表现相似,都具有较高的准确度和较低的假阳性率。这表明它们可以很好地分类数据集,并且在不产生过多误报的情况下识别出真正的阳性样本。此外,它们的训练时间和预测时间都比朴素贝叶斯和KNN要短得多。
朴素贝叶斯的准确度和假阳性率都比决策树和逻辑回归要低,这表明该模型在识别真正的阳性样本方面存在一定的困难。此外,朴素贝叶斯的训练时间比其他三种模型要短得多,这使得它成为处理大型数据集时的有用工具。
KNN的准确度较高,但假阳性率也很高。这表明该模型可能会在某些情况下将负样本错误地分类为阳性样本。此外,KNN的交叉验证分数表现不佳,这可能意味着它对于该数据集而言并不是最佳选择。”
以上,从代码编写、代码调优和结果讨论几个角度,对Colab + Monica初步体验了一番,其流畅程度无可比拟。体验过后,简单一句话来说,你缺的不再会是代码编写和执行,缺的是创新的Idea。
当然,只有你自己试过了才知道。
参考文献:
[1]https://chrome.google.com/webstore/detail/monica-your-ai-copilot-po/ofpnmcalabcbjgholdjcjblkibolbppb
[2] https://blog.google/technology/developers/google-colab-ai-coding-features/
[3] https://research.google.com/colaboratory/
HAVE FUN!
SciChat,你的专属学术和工程AI助手,只为赋能更好的你!
来扫我吧,Let’s SciChat~
原创文章,作者:门童靖博士,如若转载,请注明出处:https://www.agent-universe.cn/2023/06/11391.html