面试 AI 算法岗,项目实战与比赛经验到底能为你加成多少?
比赛1:房价预测(预测比赛初级入门)
Week 1
本周学习目标: Kaggle入门,了解kaggle竞赛的类别、类型、技巧。并注册自己的kaggle账号以及本地化notebook的知识点。了解赛题要解决的问题,数据的说明以及介绍,要运用的算法。学习并掌握数据的读取与显示、查看数据的缺失情况、查看数据的类型情况、查看特征之间的相关性。
【技能课】 kaggle账号注册与竞赛入门
【工具课】 账号注册以及本地化jupyter notebook
【思路课】 比赛思路课(kaggle房价预测)
【技能课】 数据清洗以及数据处理
【直播】 直播答疑+重点知识讲解
【实战作业】 注册好自己的Kaggle账号,本地化notebook,将数据下载到本地, 利用pandas来显示数据信息
Week 2
本周学习目标: 构建一个基本的b aseline并提交到kaggle上并有成绩,运用特征工程知识对成绩提高到Top80%,用模型的集成知识对成绩提高到Top20%。
【思路课】 构建一个基本baseline提交并且有成绩(包括模型的构建、数据预处理、结合赛题的部分特征工程知识)
【技能课】 特征工程知识部分讲解
【技能课】 特征工程对baseline的提高
【技能课】 模型集成原理与实践
【直播】 直播答疑+重点知识讲解+比赛复盘和总结
【实战作业】 完成一个基本的baseline提交到kaggle上然后有成绩,参考老师提供的代码方案,运用所学知识尝试把排名提高到Top10%
技能点:
✔ 熟悉Kaggle竞赛平台并运用其来作比赛
✔ 学会利用Pandas等进行数据的读取以及数据的处理等
✔ 学习利用Sklearn进行模型的回归预测、分类等
✔ 学习数据的EDA分析以及数据清洗、数据预处理等
比赛2:预测未来销售(预测比赛中级进阶)
Week 3
本周学习目标: 了解赛题的背景资料、数据文件的分布并下载数据和本地导入,构建baseline提交,利用查找到的背景资料来进行特征工程尝试提高成绩。
【思路课】 赛题解读以及数据下载导入、赛题的理解分析
【技能课】 特征工程以及构建baseline
【直播】 直播答疑及重点知识讲解
【实战作业】 搜集赛题背景资料,形成赛题报告;构建baseline并将成绩提高到50%以上
Week 4
本周学习目标: 在上周的基础上进行新的数据预处理和数据的特征工程的方式,包括:数据清洗、数据的特征重做、以及数据特征的增加等,最后利用xgb算法去进行拟合,并预测之后得到结果,尝试将成绩提高到Top100。
【技能课】 特征工程的数据预处理对排名的提升(1)
【技能课】 特征工程的数据预处理对排名的提升(2)
【技能课】 模型的选择以及数据归一化对结果的影响
【直播】 直播答疑+重点知识讲解+比赛复盘和总结
【实战作业】 利用本周所学知识,将成绩至少提高到 Top100
技能点:
✔ 学习特征工程与一些基础的特征构建方法
✔ 学习模型集成的一些基础知识
✔ 学习数据挖掘的常用知识点
比赛3:地震预测(预测比赛高级挑战)
Week 5
本周学习目标: 授人以鱼不如授人以渔,掌握一个赛题的基本解决思路,实现和看懂baseline,对baseline代码进一步做特征工程,将排名提升到银牌区
【思维课】 赛题背景以及数据的EDA
【实操课】 对baseline代码进一步做特征工程
【直播】 直播答疑+重点知识讲解+完整预测比赛的复盘和总结
【实战作业】 根据提供的代码,尝试将比赛成绩提高到银牌区
比赛4:基于卷积神经网络的表情识别(CV方向)
Week 6
本周学习目标: 了解本次比赛的题目和相关背景,掌握计算机视觉主要是来解决哪些问题,以及一般使用哪些工具;了解卷积的运算和经典架构,并掌握卷积的计算过程;学习Tensorflow和keras的基本编程方法,书写自己的深度神经网络。
【思路课】 赛题解读与利用kernel进行比赛
【工具课】 Google Colab的使用指导
【技能课】 卷积的基础知识和常用模型架构
【思路课】 比赛思路课
【工具课】 TensorflowKeras和OpenCV
【实战作业】 使用Tensorflow和Keras分别实现一个卷积神经网络,对fashion-mnist数据集进行分类
Week 7
本周学习目标: 根据baseline的代码举一反三,引入验证集,修改深度神经网络模型,优化方法,损失函数等,使的模型达到一个更好的效果。
【技能课】 数据准备和增强
【技能课】 构建基础baseline模型
【直播】 直播答疑+重点知识讲解+比赛复盘和总结
【实战作业】 根据讲师教授的方法和思路,尝试自己 改进baseline模型
技能点:
✔ 熟悉图像比赛流程
✔ 学会利用Python写生成器
✔ 学会利用Sklearn辅助深度学习建模
✔ 学会图像数据可视化
✔ 学习模型集成的一些基础知识
✔ 学会卷积神经网络的基础知识和常用模型
✔ 学会常用深度学习框架(tensorflow)
比赛5:“达观杯”文本智能处理挑战赛(NLP方向)
Week 8
Week 8(传统方法讲解)
【思路课】 赛前介绍和准备
【思路课】 赛题解读及比赛思路介绍
【技能课】 构建一个基础baseline模型
【技能课】 构造验证集和模型交叉验证
【直播】 直播答疑+重点知识讲解
【实战作业】 根据讲师教授的方法和思路,并提交结果
Week 9
【工具课】 快速入门tensorflow2.0
【技能课】 数据预处理
【技能课】 word2vec简介及word2vec词向量构建
【技能课】 实现一个深度学习的baseline
【技能课】 构造DNN模型验证集以及模型交叉验证
【实战作业】 根据讲师教授的方法和思路,并提交结果
Week 10
【思路课】 深度学习的模型优化
【技能课】 模型对比分析
【技能课】 参数调节与一些Tips
【直播】 直播答疑+重点知识讲解+比赛复盘和总结
【实战作业】 提交到比赛平台上然后有成绩,参考老师提供的代码方案,运用所学知识尝试把排名提高到Top1%
技能点:
✔ 学会解读NLP任务
✔ 学习利用Pandas、Numpy等进行数据的读取以及数据的处理等
✔ 学习利用TFIDF构建文本特征,并学习利用sklearn的逻辑回归、SVM等进行文本分类✔ 学习利用word2vec模型构建文本词向量
✔ 学习利用DNN模型构建文本分类模型
✔ 学习模型集成的一些基础知识
比赛6:打一场自己正在开的新比赛
预计3月份左右
NLP 方向比赛:主题暂定
【直播】 赛题分析及解读
【直播】 赛题分享
【直播】 赛题进阶
学员讨论方案,并比较不同方案的提升效果,找出原因,并寻找有无更好的方案。
老师带打,一起参加新比赛,会和你一起努力!带你冲榜刷排名,获得能写进简历的项目经验! (由于正常比赛一般都是三个月的周期,把课程学完正好是三个月以后,只能根据当时最新的比赛决定打哪场)