2021.11.21 与团队的第一次见面
***
为重点全面掌握内容,**
为整体熟悉,*
为部分掌握
一、Python
基础内容
二、机器学习算法理论与实现:(侧重于经典算法的原理推导及Python
实现)
***
李航-统计学习方法、周志华-西瓜书、南瓜书可以自行找其他的
MOOC
资源与下列MOOC
一起学习,完成MOOC
的习题及考核。若未结课的MOOC
无法看到完整习题和考核内容,可以选择往期已结束内容。
***
微信公众号:Datawhale
,机器学习算法那些事,菜鸟教程,运筹OR
帷幄,优化算法交流地。(学习生涯中请持续关注)
三、能力清单
研一同学入学前掌握:$1、2、3、4$ 。第一学期结束时需掌握:$5、6、7、8$
学习
Python
基础知识,完成经典算法的Python
实现。熟练掌握
numpy
,pandas
,matplotlib
,seaborn
,pyechart
、爬虫的相关知识。会使用Jupyter Notebook
,了解markdown
语法、可对数据进行简单处理和可视化。掌握数据探索、数据预处理、特征提取、回归、分类、聚类、集成学习的主要算法并能灵活运用。了解并能运用层次分析法
AHP
、主成分分析PCA
、贝叶斯网络、信息熵、博弈论、运筹学等相关知识和算法。(自行补充课件中没有的知识点)基于
sklearn
库运用相关算法对数据进行分析、展示和运算。具备精准查阅论文、使用
Mendeley
管理文献、准确无误编写参考文献的能力。
重点掌握以下算法:线性回归、逻辑回归、朴素贝叶斯、隐马尔可夫模型、感知机、K近邻、决策树、最大熵模型、支持向量机(Support Vector Machine,SVM
)、boosting
方法AdaBoost
。
综合应用:
完成一个数据挖掘方面的赛题论文及代码:综合应用数据预处理、常见机器学习算法及可视化分析。
2022.03.03 迭代器与内置库课件制作
迭代器
蒋宇豪:Python
的迭代器为什么一定要实现__iter__
方法?
内置库
有趣
2022.04.07 课堂笔记
2022.04.21 课堂笔记
你的硬盘有多快? 一文了解速度极限,教你提升「硬盘 / NAS
」读写性能
Office
在2010
年有一个大型版本迭代,例如Office2021
的文件就无法在Office2009
打开
2022.04.25 课堂笔记
2022.05.05 课堂笔记
2022.05.09 课堂笔记
Python中 if __name__ == ‘__main__‘:的作用和原理
Python中“if __name__==’__main__‘:”详细解析
2022.05.16 课堂笔记
三个推荐的Python
自学网站:
2022.05.26 课堂笔记
2022.10.24 课堂笔记
2022.10.31 课堂笔记
可视化:matplotlib(Python基本绘图库,类似于Matlab)
seaborn(与pandas库相性较好)
pyecharts(交互性更好,可生成动态旋转三维图;入门门槛高,同时由于其基于javascript,故需要下载代码对应的js代码才能运行,等待时间较长)
2022.11.7 课堂笔记
dblp-计算机方面论文,查找标题作者等(全文需要到elsevier等网站下载)