AI一天,人间一年!Grok3距离媒体公布才几天,就已经免费开放。堆了20万张 GPU、号称“宇宙最聪明”大模型 Grok-3 已经可用了。
这个名叫Grok3 的AI模型横空出世,号称是”宇宙最聪明”的AI。它由马斯克旗下公司xAI开发,据说拥有强大的推理能力和深入研究模式,可以轻松解决各种复杂问题。
Grok的深入研究模式是其最大的亮点之一。在这个模式下,Grok会对问题进行深入分析,挖掘问题的本质,并提供全面的解决方案。
例如,如果你问Grok:”如何提高公司的销售额?”Grok会深入分析公司的现状、市场环境、竞争对手等因素,并提出一系列切实可行的建议,如优化产品、加强营销、拓展渠道等。
此外,Grok能够像人类一样进行逻辑推理,分析问题,并给出合理的解决方案。例如,如果你问Grok:”如果小明比小红高,小红比小刚高,那么小明和小刚谁更高?”Grok会通过推理得出结论:小明比小刚高。
那么,这个Grok3到底神不神?让我们结合实际场景一探究竟。
话不多说,我们直入主题,打开网页,当你看到如下提示“Grok3 Enabled”时,那么,就证明你的Aha时刻到了。
一. Grok3 DeepSearch高级搜索和推理能力到底如何?
我们还是以科研场景为例,即一名科研人员计划对一个研究领域做一个文献综述。
这里测试的提示语:“我是一名科研人员,想了解最新的关于物联网交通的研究进展现状,做一个文献综述,注意一点,所有文献必须属实。”
作为Grok的高级检索与推理功能,首先我们来看下DeepSearch的效果如何,打开DeepSearch。
Grok3的思考和反馈如下,思考链路和步骤在左边导航栏,而整个思考过程在右边栏。
整个思考过程花了46秒,检索了53 信息来源,思考链路如下。
探索物联网运输领域->筛选最新研究->评估论文内容->整合文献综述->分析挑战与未来->整理文献引用。
这条思路无疑可以帮助科研人员理清思路,对落地的工作提供向导。
用户角色、关键词搜索,以及检索出来的文献索都来自知名来源,如Sciencedirect, Researchgate等,且和主题都是非常相关。
尝试左边导航筛选最新研究,获取2024年最新的文章。
然后在下面提供了一份该领域文献综述的示范文章,研究人员亦可以通过该领域的综述文章,提供一些关于当前研究现状Gap的灵感。
输出内容如下,从框架和基本内容上来看基本涵盖了,可以作为一个综述小文章,但是要作为可以发表的综述文章,那肯定是不够的,但思考过程和输出内容的确有了一定的深度,并且也具备一些翔实的事实佐证。
当然,这个可能和提示词有关系,比如我们只是简单的要求做一个综述,并没有要求以什么要的期刊标准作为综述要求。
二. Grok3 Think能否真正成为一名深度思考的学者?
接下来我们打开Think,看看推理模式的效果到底如何?我们先点亮Think~
这里顺便提一下,当你点亮Think功能的时候,你可以Enable 或 Disable 搜索功能,就类似DeepSeek-R1的思考+搜索。
还是以同样的提示指令输入:“我是一名科研人员,想了解最新的关于物联网交通的研究进展现状,做一个文献综述,注意一点,所有文献必须属实。”
接下来我们先看思考过程,从输出可以看出,思考过程似乎都已经将输出内容基本涵盖了。
而输出内容,基本和思考过程大同小异,这里也就不再赘述。
还是以同样的提示指令输入,从思考过程来看,DeepSeek的内容更倾向于产业界相关,而不像Grok3对提示符的理解倾向于学术届,这个可能也是因为中文在两者AI理解上的微妙差别。
从搜索的结果上看,如果以学术科研的输出质量上看,DeepSeek似乎略逊一筹,过于接地气了,比如豆丁网,百家号这些都不能称之为学术资源。
同样在结果上,也是更像产业咨询类的综述,而非学术期刊综述。这里节选一部分内容。
当然,结果仅供参考,对比不是本文的主题,后续也会对两者在进行更为公平和深入的对比研究。
以上,DeepSearch深度研究的过程和结果的确让人耳目一新,尤其是搜索的资源数量和与主题的相关度,很适合学术研究者快速获取框架、资源和灵感。
而Think功能似乎没那么让人印象深刻,因为思考过程和结果输出几乎差别不大,但作为DeepSearch的补充还是不错的。
另外,DeepSeek在这次同样指令下的思考过程和输出似乎稍逊一筹,这个还需要更多实践来发现。
Grok3还留了一手SuperGrok,但是要30美刀/月,毕竟AI一天,人间一年!我们还是先让子弹飞一会…
你对Grok的能力怎么看?它是否真的能为科研带来革命性变化?赶紧试试吧,欢迎在评论区分享你的看法!
关注我,了解学术研究之路中关于AI的一切~
原创文章,作者:门童靖博士,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/39404.html