Google Colab中的AI Monica真的无敌了，轻松编写和调优程序!

这两天刚好在调程序中，无意中用到了Google Monica，真的让人惊叹不已！

先给结论：编写、调优程序，解释运行结果基本无障碍！

Colab + Monica的流畅和无缝程度，应该远超当时我发过的一篇基于Colab + ChatGPT文章中的效果《GoogleColab + ChatGPT 堪称一站式科研提速神器（堪称代码语法苦恼者的福音）！》。

最关键的是，它是免费的！

这里就不对安装和基本的操作展开聊了，大家可自行去下载安装，我们直接进入主题，看看在Google Colab下用Monica会有怎样的神奇效果！

Google Colab + Monica环境准备

这是Google Colab当前的主页面，经过一段漫长的过程，数据已经完成了pre-processing，接下来基本上可以对已经预处理的数据，用一些常规的算法进行transform。

Monica安装完成后，在侧面会有一个Monica的小浮标

点击之后会出现如下对话框，它支持聊天、写作和备忘，并且支持GPT3.5 Turbo, GPT4, 艺术设计和团队支持！

这些功能，大家可以自行探索，这篇文章主要聚焦Google Colab + Monica中的一些代码操作。

1. 生成代码的能力如何？

为了简单起见，我直接用中文提出一个问题：

“我有一个已经经过预处理的数据集，并且通过df读取了，请写一段代码来对该数据进行PCA，并通过图像展示出来，需要注意的是不同类的instance展示不同的颜色。”

Monica的回答“好的，以下是一段Python代码，可以使用PCA对数据进行降维，并通过图像展示出来，不同类的instance会用不同的颜色表示：”

“其中，your_dataset.csv是你的数据集文件名，label是数据集中的标签列名。你需要将这些变量替换成你自己的变量名。n_components可以设置为你想要的主成分数量。在这个例子中，我们选择了2个主成分，因为我们想要将数据可视化成2D图像。colors和labels分别表示每个类别对应的颜色和标签。”

直接将代码Copy/Paste至Colab的代码框中，并按照它的提示，将数据集名称和标签名修改。

直接运行代码，结果如下：

从结果可以看出，经过PCA之后的数据集分布情况，由于该数据集分类实际上只有两类，所以结果只有红色和绿色，并没有蓝色的数据点。

代码生成能力没问题！

2. 能否基于生成的代码进行优化？

考虑到PCA只设置了两个维度，从图上的结果看，两类数据点的分布并不非常明显，那么我们再增加一个维度，来看看能否找到这两类数据点更为合理的界限。

所以，提出相应问题如下：

直接将代码Copy/Paste至Colab的代码框中，并按照它的提示，将数据集名称和标签名修改：

直接运行代码，结果如下：

我们通过提问，进一步将图像结果进行优化：

“能否将三维图的背景改为黑色，并且将尺寸放大2倍？”

“是的，可以通过设置坐标系的属性来将三维图的背景改为黑色，并且可以通过设置figsize参数来将图像尺寸放大2倍。以下是修改后的代码：”

直接将代码Copy/Paste至Colab的代码框中，并按照它的提示，将数据集名称和标签名修改：

直接运行代码，结果如下：

以上，你可以根据自己的需求，进一步对结果进行优化。

3. 解释运行结果的能力如何？

下面是一段通过各种机器学习算法，比如Decision Tree、Logistic Regression, Random Forest，Xgboost等算法对数据进行运算后的性能结果：

选择这些结果，Monica便自动将内容copy/paste至右侧对话框中，并提示我们希望对该文本进行什么操作～

选择摘要：

“您希望对文本进行什么操作？”

“用原文语言概括这段文字。”

Monica直接给出了摘要结论：这段文字是对四个不同分类器（决策树、逻辑回归、朴素贝叶斯和KNN）在一个数据集上进行性能比较的结果。每个分类器都包括交叉验证得分、分类报告、混淆矩阵、准确率、误报率、训练时间、预测时间和CPU和内存使用情况等指标。其中，决策树和逻辑回归的表现相似且较好，而朴素贝叶斯的表现相对较差。