AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

ClaudeChatGPT这两个AI工具,在学术领域的工作当中到底哪家强呢

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

接上一篇文章 《AI学术 | 写Research Proposal, Claude和ChatGPT哪家强?

刚好碰到一个技术问题,涉及到理论和编码实践,让我们来看看两者在处理具体的技术问题上,各自表现如何。


一. 具体问题(开始挖坑)

目前是这样的场景,我们正在一个数据集进行预处理(Data Preprocessing),并对其用机器学习(Machine Learning)建模,从而生产高准确率的分类模型(Classification)。

为了得到更为轻量级的模型(Lightweight model),我们需要对数据集进行降维,其中一种办法就是对数据集的特征进行选择(Feature Selection),而常用的特征选择的方法之一,就是通过Pearson Correlation技术选择与目标类高相关度的特征

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

那么问题来了(开始挖坑)假设我现在仅考虑了特征之间的相关度,而忽略了特征与目标类的相关度,我们看看Claude和ChatGPT会如何应对。


二. 理论对话

我们提出如下同一个问题,来各自询问Claude和ChatGPT,看看他们的答复。“I’ve just implemented the correlation-based feature selection technique, which only considers the correlation between features but not the correlation between features and target values. I’m not sure if this method makes sense.

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

  • Claude

    它直接认为仅考虑特征间的关联性,而忽略特征与目标类的关联性,并非一个好的选择。

    然后,Claude进而给出了,为什么应该要考虑与目标类的关联性。

    其中还提出了,不能仅仅考虑线形关系,还得考虑非线形关系,并且还推荐了一些具体的技术,比如mutual information技术。

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?


  • ChatGPT

同样,ChatGPT也认为更应该考虑与目标类的关联度。但并没有推荐更具体的其他相关技术。

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

从上述回答来看,Claude和ChatGPT都能够指出具体的问题出在哪里,即只考虑了A,但没有考虑B,B很重要,应该采取A+B的策略;

(A代表特征之间的关联性,B表示各个特征与目标类的关联性,为了方便,后续就以A和B代替。)

区别在于,Claude会推荐更多的技术,比如也可以考虑非线形的方案;而ChatGPT仅聚焦在当前Pearson correlation技术上


. 来看代码

我们继续提出如下同一个问题,来各自询问Claude和ChatGPT,看看他们的答复。“OK, so would you please write code to implement it?

  • Claude

    从下面代码可以看出,Claude把A和B都考虑到了,并给出了最终的特征列表。

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?


  • ChatGPT

相信大家看到了这一段代码,立马就知道问题所在了。没错,ChatGPT依然只考虑了A,即只考虑了特征与目标类的关联性,而没有考虑特征之间的关联。

# Select features based on the correlation threshold

selected_features = correlation_with_target[abs(correlation_with_target) > correlation_threshold].index

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?


鉴于可能是ChatGPT的偶然失误,我们继续追问 “Sorry, it seems you only considered the correlation with target class, where is the correlation between the features?

ChatGPT倒是很诚实,给出了道歉,并继续修改上述代码。

但请仔细看,有没有问题?

依然有!它增加了部分B如下,

# Calculate the correlation matrix (features vs. features)

correlation_matrix = X_train.corr()

但是最终选择的特征依然还是和之前一样!

selected_features = correlation_with_target[abs(correlation_with_target) > correlation_threshold].index

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?


鉴于可能是ChatGPT的偶然失误,我们继续追问 “Sorry, the features fed into machine learning, do not consider the correlation values within feature, can you modify the code to consider it?

这次的问题又在哪呢?

是的,依然没有将B的因素,考虑到最终输入到机器学习模型的特征列表中!

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?


我们继续追问 “Sorry, you still don’t understand my words, I mean can you select the features that consider both correlation within features and correlation with target class?

这次终于把B考虑到最终列表中了~

但是我们需要的是,最大化A,同时最小化B,因为特征间的关联度越高,代表该特征可能是多余特征,进而忽略。

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?


所以,我们继续追问 “However, the best feature sets should be the features that have high correlation with target class, and low correlation with each other, no?(从问题就可以看到,我的耐心已经快到极限了…AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

终于把下面这个大于号改成小于号了:

# Also consider the correlation between features

for col in correlation_matrix.columns[:-1]:

    correlated_features = correlation_matrix[abs(correlation_matrix[col]) < correlation_threshold].index

    selected_features.update(correlated_features)

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

这里可以看到,ChatGPT并没有直接用现成的SelectKbest方法,而Claude则直接调用,代码层面比ChatGPT要干净很多;

当然ChatGPT给出了完整的从数据预处理,模型训练到性能评估的整个过程,而Claude仅给出了生成的特征列表。


以上,从代码上来看,Claude在理解上下文,并给出相应的答案上更为精准。

ChatGPT在精准度上,有点放飞自我,尤其是其中还反过来给我挖坑(计算了B,但没有把B的结果结合到A中),更是让人哭笑不得。

当然,ChatGPT在经过数轮调教之后,还是能够回到正轨上,对于交互和理解问题上,还是很有帮助。当然,从工作效率的角度上,ChatGPT比Claude是要欠缺一些。

以上,仅在具体领域的具体问题上的比较,结果仅做参考。

大家也可以自己尝试一下,看是否真的如我所说~


参考文献:

[1]https://claude.ai/chat/

[2]https://chat.openai.com/

[3]https://en.wikipedia.org/wiki/Correlation

[4]https://www.analyticsinsight.net/key-difference-between-claude-ai-and-chatgpt/


HAVE FUN!

Let’s SciChat,你的专属AI学术和工程助手

来扫我吧~

AI学术 | 解决技术问题, Claude和ChatGPT哪家强?

原创文章,作者:门童靖博士,如若转载,请注明出处:https://www.agent-universe.cn/2023/10/10733.html

Like (0)
Previous 2023-10-17 12:36
Next 2023-10-19 11:01

相关推荐

  • 大模型日报(9月4日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-04
    303
  • Meta(Facebook)终于按耐不住, 六模态开源AI模型ImageBind到底如何?

    Meta(Facebook)终于按耐不住,也推出了自己的基于计算机视觉的多模态开源AI模型ImageBind! 这是目前第一个能够同时绑定来自六种模式数据的 AI 模型,且无需明确…

    2023-05-11
    274
  • AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (三)

    有一段时间没有更新,我们继续把AIgents的内容更新完成… AIgents提供了清晰可交互的学习路线图,在数据科学和机器学习领域的探索过程中,有了这张地图,你就不容易…

    2023-08-11
    108
  • 大模型日报(4月10日 学术篇)

    特别活动! 欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 论文 01 鹰与金翅雀:使用矩阵值状态和动态…

    2024-04-10
    218
  • 大模型日报(7月30日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-30
    213
  • 大模型日报(7月23日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-23
    267
  • 大模型日报(6月11日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 论文 0…

    2024-06-11
    204
  • 大模型日报(4月13~14日 学术篇)

    欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 学习 01 AI 集群基础设施 InfiniBand 详…

    2024-04-14
    168
  • 大模型日报(8月2日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-02
    284
  • ChatGPT九步完成高质量Grant Proposal!

    ChatGPT是一款强大的人工智能语言模型,通过对大量文本数据的训练,可以生成高质量的文本内容。 如果您正在准备Grant Proposal,不妨用ChatGPT试试以下九步完成高…

    2023-03-27
    107