揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?

AI一天,人间一年!Grok3距离媒体公布才几天,就已经免费开放。堆了20万张 GPU、号称“宇宙最聪明”大模型 Grok-3 已经可用了。
这个名叫Grok3 的AI模型横空出世,号称是”宇宙最聪明”的AI。它由马斯克旗下公司xAI开发,据说拥有强大的推理能力深入研究模式,可以轻松解决各种复杂问题

Grok的深入研究模式是其最大的亮点之一。在这个模式下,Grok会对问题进行深入分析,挖掘问题的本质,并提供全面的解决方案。

例如,如果你问Grok:”如何提高公司的销售额?”Grok会深入分析公司的现状、市场环境、竞争对手等因素,并提出一系列切实可行的建议,如优化产品、加强营销、拓展渠道等。

此外,Grok能够像人类一样进行逻辑推理,分析问题,并给出合理的解决方案。例如,如果你问Grok:”如果小明比小红高,小红比小刚高,那么小明和小刚谁更高?”Grok会通过推理得出结论:小明比小刚高。

那么,这个Grok3到底神不神?让我们结合实际场景一探究竟。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


话不多说,我们直入主题,打开网页,当你看到如下提示“Grok3 Enabled”时,那么,就证明你的Aha时刻到了。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


一. Grok3 DeepSearch高级搜索和推理能力到底如何?
我们还是以科研场景为例,即一名科研人员计划对一个研究领域做一个文献综述。
这里测试的提示语:“我是一名科研人员,想了解最新的关于物联网交通的研究进展现状,做一个文献综述,注意一点,所有文献必须属实。
作为Grok的高级检索与推理功能,首先我们来看下DeepSearch的效果如何,打开DeepSearch。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


输入提示语后:
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
Grok3的思考和反馈如下,思考链路和步骤在左边导航栏,而整个思考过程在右边栏。
整个思考过程花了46秒,检索了53 信息来源,思考链路如下。

探索物联网运输领域->筛选最新研究->评估论文内容->整合文献综述->分析挑战与未来->整理文献引用。

这条思路无疑可以帮助科研人员理清思路,对落地的工作提供向导。

揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


接下来我们看右边栏:
用户角色、关键词搜索,以及检索出来的文献索都来自知名来源,如Sciencedirect, Researchgate等,且和主题都是非常相关。
通过文章链接,可以直接访问该文章。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


尝试左边导航筛选最新研究,获取2024年最新的文章。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


这里有个非常有意思的亮点,文章太多了~
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
然后在下面提供了一份该领域文献综述的示范文章,研究人员亦可以通过该领域的综述文章,提供一些关于当前研究现状Gap的灵感。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


输出内容如下,从框架和基本内容上来看基本涵盖了,可以作为一个综述小文章,但是要作为可以发表的综述文章,那肯定是不够的但思考过程和输出内容的确有了一定的深度,并且也具备一些翔实的事实佐证。
当然,这个可能和提示词有关系,比如我们只是简单的要求做一个综述,并没有要求以什么要的期刊标准作为综述要求。
后续也可以更多的尝试~
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


二. Grok3 Think能否真正成为一名深度思考的学者?
接下来我们打开Think,看看推理模式的效果到底如何?我们先点亮Think~
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
这里顺便提一下,当你点亮Think功能的时候,你可以Enable 或 Disable 搜索功能,就类似DeepSeek-R1的思考+搜索。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?




还是以同样的提示指令输入:“我是一名科研人员,想了解最新的关于物联网交通的研究进展现状,做一个文献综述,注意一点,所有文献必须属实。
思考过程33秒~
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


接下来我们先看思考过程,从输出可以看出,思考过程似乎都已经将输出内容基本涵盖了
而输出内容,基本和思考过程大同小异,这里也就不再赘述。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


三. 同等条件下,DeepSeek的表现如何呢?
我们也默认将深度思考和联网搜索打开。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


还是以同样的提示指令输入,从思考过程来看,DeepSeek的内容更倾向于产业界相关,而不像Grok3对提示符的理解倾向于学术届,这个可能也是因为中文在两者AI理解上的微妙差别。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


从搜索的结果上看,如果以学术科研的输出质量上看,DeepSeek似乎略逊一筹,过于接地气了,比如豆丁网,百家号这些都不能称之为学术资源。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


同样在结果上,也是更像产业咨询类的综述,而非学术期刊综述。这里节选一部分内容。
当然,结果仅供参考,对比不是本文的主题,后续也会对两者在进行更为公平和深入的对比研究。
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


以上,DeepSearch深度研究的过程和结果的确让人耳目一新,尤其是搜索的资源数量和与主题的相关度,很适合学术研究者快速获取框架、资源和灵感
Think功能似乎没那么让人印象深刻,因为思考过程和结果输出几乎差别不大,但作为DeepSearch的补充还是不错的。
另外,DeepSeek在这次同样指令下的思考过程和输出似乎稍逊一筹,这个还需要更多实践来发现。
Grok3还留了一手SuperGrok,但是要30美刀/月,毕竟AI一天,人间一年!我们还是先让子弹飞一会…
揭秘“宇宙最聪明”AI Grok3: 它的深入研究和推理能力,能否成为科研新利器?


你对Grok的能力怎么看?它是否真的能为科研带来革命性变化?赶紧试试吧,欢迎在评论区分享你的看法!

关注我,了解学术研究之路中关于AI的一切~


原创文章,作者:门童靖博士,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/39404.html

Like (1)
Previous 2025-02-20 18:00
Next 2025-02-21 12:04

相关推荐