有一段时间没有更新,我们继续把AIgents的内容更新完成…
AIgents提供了清晰可交互的学习路线图,在数据科学和机器学习领域的探索过程中,有了这张地图,你就不容易再迷路了!
接上两篇关于AIgents的文章《AI学术 | AIgents 数据科学和机器学习,精准省时又免费的学习向导! (一)》和《AI学术 | AIgents 在数据科学和机器学习领域的学习向导! (二)》,我们继续探索数据科学和机器学习的交互式Roadmap(Interactive Roadmap)。
1. 选择深耕路径
主要有三条路径,一条是数据科学,再往下就是机器学习和深度学习;另外一条是数据工程;此外还有Python工程,这个目前还没提供服务。
1.1 数据科学
主要包含两大部分:
一块是统计部分,包括概率理论、连续分布、离散分布、汇总统计、大数法则、假设验证、置信区间、蒙特卡洛等模块。主要强调的是概念和理论,对于其中任意概念,都可以点击进入进行深入了解。
比如进入Chi-squared, “卡方分布是一种统计分布,用于描述理论假设数据与实际数据之间的关系。它是假设检验中的非参数检验,用于确定双变量数据或记录中两个分类特征之间的关联。该分布是伽玛分布的特例,通常用于卡方拟合优度检验和卡方独立性检验。”
并且还关联Towards data science中高相关度的文章,可供阅读释疑。
另一块是数据可视化,主要提供的是各类可视化工具,其中涉及到的知识点和工具大家可以自行探索。
点击”Chart Suggestions”,可以概览所有的可视化图形。
选择相应的图例,便会提供相应图例的解释,比如箱图。
1.2 机器学习
机器学习主要分为了这几大块,一块是机器学习的基本概念,一块是机器学习方法,一块是通过Python来实现机器学习实践,最后一块是机器学习模型的部署实践。
基本概念包括,数据的基本类型,训练高泛化能力所需检验的Cost函数和梯度下降,机器学习常见的过拟合与欠拟合问题,用于训练和测试模型的数据,用于验证模型的性能参数如Precision和Recall,模型中常出现的高Bias和Variance问题等。
机器学习的几种基本类型,包括监督学习、无监督学习、集成学习和强化学习,而具体到各类型的学习,又提供了相应的机器学习的算法,具体大家可以自行探索。
机器学习的实践离不开Python和相应的库,比如常用的Scikit-learn,数据预处理Pandas,神经网络Tensor-flow, pytorch,数据分析图形展示Matplotlib等。
在模型训练并验证完成之后,就需要将模型部署至实际的环境中,这里就会用到Kubernetes, Dockers等。大家可以沿着这条路径尝试一个完整的机器学习Pipeline。
接下来是深度学习部分,你可以在下面找到深度学习工程师路线图,即有关如何成为深度学习专家的分步指南。当然,这不是初学者赛道,在踏上这条道路之前,请确保你已经完成了上述的路线图。首先就是要学会看Paper!
篇幅所限,将在后续的文章继续探讨Deep Learning的学习路线图,将继续完善深度学习部分…
Reference:
[1]https://aigents.co/learn/roadmaps/data-science-roadmap
[2]https://datavizcatalogue.com/
[3]https://aigents.co/learn/roadmaps/machine-learning-roadmap
HAVE FUN!
Let’s SciChat,你的专属AI学术和工程助手
来扫我吧~
原创文章,作者:门童靖博士,如若转载,请注明出处:https://www.agent-universe.cn/2023/08/10924.html