以下是我自己的学习路线,至少是我目前能回忆起来的一些学习路线,希望能帮到你们。虽然我之前学过前端的网站搭建框架,但是我忘了,因为我好久不用了,所以就不在这里介绍了。
一、python基础
基础 |
---|
环境搭建 |
注释 |
变量 |
数据类型 |
数学计算 |
字符串 |
布尔值 |
列表 |
元组 |
集合 |
字典 |
控制流 |
函数 |
面向对象 |
继承 |
日期 |
JSON数据处理 |
格式化输入输出 |
警告处理 |
文件的基本处理 |
二、数据处理
需要掌握的模块:
模块 |
---|
pandas |
numpy |
三、数据可视化
以下是常见需要绘制的图形,是需要掌握的:
内容 |
---|
子图 |
散点图 |
折线图 |
柱形图 |
直方图 |
扇形图 |
K线图 |
箱型图 |
热力图 |
省市地图 |
水球图 |
个人建议需要掌握的模块:
模块 |
---|
Matplotlib |
Seaborn |
Pyechart |
五、网页基础与网络爬虫
需要掌握的网页基础内容:
内容 |
---|
HTML |
CSS |
JS |
需要掌握的网络爬虫内容:
基本模块 |
---|
urllib |
requests |
re |
Xpath |
bs4 |
selenium |
Scrapy |
六、数据与服务器的管理
需要掌握的内容:
需要掌握 |
---|
SQL |
Linux |
七、机器学习十大基本算法
以下是我脑子能想到比较常见的又还会的,不分顺序:
算法 |
---|
线性回归 |
Logistic 回归 |
逐步回归 |
正则化(岭回归) |
决策树 |
朴素贝叶斯 |
k-邻近算法(kNN) |
Kmeans聚类 |
支持向量机(SVM) |
随机森林(Random Forest) |
主成份分析 |
主成分回归(PCR) |
灰色关联 |
皮尔逊相关性 |
特征选择算法 |
XGBoost算法 |
LSTM模型 |
ARMA模型 |
神经网络 |
如果有时间,希望把西瓜书啃一遍。关于机器学习算法,可以使用Python和Matlab。哪样方便哪样来,本篇主要是介绍的Python,暑假我会更新一套完整的Matlab教程。
八、最后几句话
学习的过程不是一帆风顺的,一定要坚持。数据挖掘工程师在国内是很缺少的,自己打开招聘看看就知道了,对于有经验的数据工程师,至少都是两万起步,基本都能达到三万,这仅仅是公司的基本工资,如果还有股权,以及自己外快,具体自己算(不过要慢慢积累,不是说毕业就这么厉害了)。以上是我个人所学知识,但是对这些掌握也不能说是完全掌握,所以准备是要复习一遍。
对于学生,接触数据挖掘最多的应该就是大学期间的各种数学建模竞赛了,挑战性很强。最后说一句,不是你拿奖了,就代表你有这个实力了,不是说你没拿奖,就代表你没有这个实力了,数学建模竞赛,老玩家懂的都懂了,所以我就不直言。但是这个竞赛,我就把它定义为数据挖掘了。
欢迎你与我联系:点击查看
附上刷题网站,免费刷:牛客网