AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

AIgents提供了清晰可交互的学习路线图数据科学和机器学习领域的探索过程中,有了这张地图就不容易再路了

接上一篇关于AIgents的文章《AI学术 | AIgents 数据科学和机器学习,精准省时又免费的学习向导! (一)》,我们探索交互式Roadmap(Interactive Roadmap)。

考虑到篇幅,这里先探讨一下数据科学的必备知识基本功两部分。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


交互式Roadmap!(Interactive Roadmap)

触手可及的学习资源如此之多,因此,很容易让我们迷失方向。 为此,这个交互式“路线图”可以很好地解决这个问题。 

交互式图表可以显示你应该学习的主题,以及你希望采用的技术,来像数据科学家或机器学习工程师一样的思维和工作方式。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

在Roadmap中,比如,黄色方框是重点研究对象,蓝色盒子是需要掌握的工具,点击其中的方框即可找到相应的学习资源。



一. 必备知识和相关工具

无论你要成为数据科学家、机器学习或深度学习专家、Python工程师或者是数据工程师,你都无法绕开这个过程!

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


比如我们点击Git – version control,即可看到GPT的解释,以及Git version control的推荐文章。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


比如点击蓝色的工具框,如用于编码的notebook:

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


或者Google Colab等支持云端部署和协同的开发工具:

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


二. 数据科学和机器学习前的基本功

在学习数据科学或数据工程之前,我们需要了解数据分析、统计和最常用框架的基础知识。在进入任何其他路径之前,非常有必要先遵循以下路径。

通过点击如下“Fundamentals Start here!” 来看看需要具备哪些基本功!

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

其中,黄色方框是重点研究对象,紫色框是子主题,蓝色盒子是需要掌握的工具,点击其中的方框即可找到相应的学习资源。


2.1 首先是Basics

其中包含,矩阵和线性代数基础,数据库基础知识(关系型、非关系数据库),SQL、NoSQL。再比如数据类型,有表格数据,DataFrame,时序数据、ETL(提取、转换、加载)、数据报告和BI分析、相应的数据格式(JSON、XML、CSV)、正则表达式(RegEx)等。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

对于其中的黄色框知识、紫色框子主题、蓝色框工具都可以点击进去获得详细的资料。比如线性代数:

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)



再比如MongoDB

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


比如Jason数据格式

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


2.2 其次是Python Programming

主要包含Python语言基础、关于DS和ML的比较重要的库、和开发环境等资源,实际上关于Python的教程太多了,这里就不具体举例了。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


比如函数(Function)

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


比如Pandas,之前也写过一篇通过AIPandas来实现数据预处理。

数据预处理 | 你终于可以和Pandas说人话了,因为Pandas AI来啦!

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


2.3 数据来源(Data Sources)

这里主要有三个数据来源,通过Data Mining,亦可以通过网络爬虫获取,此外也可以找一些公开的数据集,比如Kaggle。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


关于数据源,点击Public Datasets,可以直接访问到Github上开源的数据集,覆盖各行各业。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


2.4 Exploratory Data Analysis(EDA)

学会了基本功,熟悉了Python和开发环境,有了数据集之后,那么就可以根据问题,来对数据集进行探索分析了!

比如,用PCA降维(Dimensionality Reduction)来降低数据挖掘或者机器学习的复杂度,比如通过数据的归一化(Normalization)来平衡不同特征的数值的幅度,数据清洗(Data Cleaning)处理缺失值和重复值等。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

通过EDA,来使得数据经过必要的预处理(Pre-processing),从而让后续的数据挖掘和机器学习算法更有效地对数据进行转化和学习


2.5 此外,这里有一个学习社群,你也可以在这里找到同行者。

在自身学习完每个知识点,并且进行了相应的实践后,你也可以加入到学习计划和社群当中,进一步体验沉浸式学习。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)



在这里有每周的学习计划。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


并且内容都是由浅入深

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)



也可以和社群里的成员一起互动。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)



你也可以检验一下自己的学习成果,每个阶段也有小Quiz。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


最后,还有一个答疑的过程,固化所学习的知识。

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


在完成了上述基本功后,便可以进一步选择专业领域的学习路径了,比如数据科学,或者是数据工程

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)


篇幅所限,将在后续的文章继续探讨Data Science、Machine Learning、Deep Learning和Data Engineering学习路线图!


Reference:

[1]https://aigents.co/learn/roadmaps/

[2]https://aigents.co/learn/roadmaps/fundamentals

[3]https://community.aigents.co/spaces/9010170/content



HAVE FUN!

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)



Let’s SciChat,你的专属AI学术和工程助手

来扫我吧~

AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)

原创文章,作者:门童靖博士,如若转载,请注明出处:https://www.agent-universe.cn/2023/07/10942.html

Like (0)
Previous 2023-07-23 23:41
Next 2023-07-25 21:56

相关推荐