AINLP年度阅读收藏清单

我们的公众号AINLP,致力于做一个有趣有AI的NLP公众号,作者是我爱自然语言处理博客博主,NLPJob、课程图谱网站”保姆”,曾在腾讯从事文本挖掘相关工作。AINLP 关注自然语言处理、机器学习、深度学习相关技术,关注人工智能、文本挖掘相关算法研发职位,关注MOOC相关课程和公开课。公众号直接对话双语聊天机器人、调戏夸夸机器人、尝试自动对联、作诗机,使用中英机器翻译,查询相似词,计算相似度,玩词语加减游戏,测试NLP相关工具包,欢迎来聊,欢迎关注。

以下是一些文章和资源的相关索引:

如何学习NLP和NLP相关资源

如何学习自然语言处理:一本书和一门课

如何学习自然语言处理:NLP领域经典《自然语言处理综论》英文版第三版更新

2019斯坦福CS224n深度学习自然语言处理课程视频和相关资料分享

CS224N 2019最全20视频分享:斯坦福大学深度学习自然语言处理课程资源索引

李纪为博士:初入NLP领域的一些小建议

老宋同学的学习建议和论文:听说你急缺论文大礼包?

从老宋的角度看,自然语言处理领域如何学习?

刘知远老师NLP研究入门之道:NLP推荐书目

NLP研究入门之道:自然语言处理简介

NLP研究入门之道:走近NLP学术界

NLP研究入门之道:如何通过文献掌握学术动态

NLP研究入门之道:如何写一篇合格的学术论文

NLP研究入门之道:本科生如何开始科研训练

自然语言理解难在哪儿?

好的研究想法从哪里来

你是如何了解或者进入NLP这个领域的?

NLP is hard! 自然语言处理太难了系列

BERT及预训练模型相关文章

BERT相关论文、文章和代码资源汇总

李如同学的文章:

【NLP】ALBERT粗读

竞赛相关

AI Challenger 2017 奇遇记

AI Challenger 2018 简记

AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总

AI Challenger 2018 机器翻译冠军参赛总结

AI Challenger_2018英中文本机器翻译_参赛小结

AI Challenger 2018 冠军 PPT 分享—细粒度情感分析赛道

AI Challenger 2018 冠军代码分享—细粒度情感分析赛道

AI Challenger 2018 第4名PPT分享—细粒度情感分析赛道

提供一个10分钟跑通 AI Challenger 细粒度用户评论情感分析的fastText Baseline

FlyAI算法竞赛平台初体验

法研杯要素识别第二名方案总结:多标签分类实践与效果对比

2019法研杯比赛–阅读理解任务第4名团队参赛总结

法研杯cail2019阅读理解比赛记录(第5名团队分享)

【Github】2019年达观信息提取比赛第九名代码和答辩PPT

CCF BDCI2019 金融信息负面及主体判定 冠军方案解析

开源项目及资源

中文自然语言处理相关的开放任务,数据集,以及当前最佳结果

用于中文闲聊的GPT2模型:GPT2-chitchat

中文歌词生成,缺不缺语料?这里有一个开源项目值得推荐

深度学习资源大列表:关于深度学习你需要了解的一切

funNLP: 从文本中抽取结构化信息的超级资源包

NLP 2018 Highlights:2018自然语言处理技术亮点汇总

NLP Chinese Corpus项目:大规模中文自然语言处理语料

Awesome-Chinese-NLP:中文自然语言处理相关资料

Jiagu:中文深度学习自然语言处理工具

上百种预训练中文词向量:Chinese-Word-Vectors

lazynlp:构建大规模语料库的”懒人”工具箱

关于聊天机器人,这里有一份中文聊天语料库资源

复旦NLP实验室NLP上手教程

AI算法工程师手册

NLP学习新资料:旧金山大学2019夏季自然语言处理课程

中文自然语言处理数据集:ChineseNLPCorpus

【Github】nlp-journey: NLP相关代码、书目、论文、博文、算法、项目资源链接

NeuralNLP-NeuralClassifier:腾讯开源深度学习文本分类工具

【Github】Chinese-poetry: 最全中华古诗词数据库

【Github】ML-NOTE:注重数学推导的机器学习算法整理

【Github】All4NLP:自然语言处理相关资源整理

【Github】GPT2-Chinese:中文的GPT2训练代码

【Github】nlp-tutorial:TensorFlow 和 PyTorch 实现各种NLP模型

【Github】ML-NLP:机器学习、NLP面试中常考到的知识点和代码实现

【Github】Data Competition Top Solution: 数据竞赛top解决方案开源整理

【Github】nlp-roadmap:自然语言处理路相关路线图(思维导图)和关键词(知识点)

【Github】TextCluster:短文本聚类预处理模块 Short text cluster

其他相关

认真推荐一份深度学习笔记:简约而不简单

神经网络佛系炼丹手册

通过Docker部署深度学习项目环境

GPU 显存不足怎么办?

AINLP-DBC GPU 使用体验指南

200行写一个自动微分工具

定个小目标,发它一个亿条微博语料

推荐两份NLP读书笔记和一份NLTK书籍代码中文注释版

微软深度学习入门教程更新

Gilbert Strang教授的MIT公开课:数据分析、信号处理和机器学习中的矩阵方法

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

如何计算两个文档的相似度一

如何计算两个文档的相似度二

如何计算两个文档的相似度三

Hands-on Machine Learning with Scikit-Learn and TensorFlow 学习笔记

感知智能到认知智能中对知识的思考

polyglot:Pipeline 多语言NLP工具

A/B测试的数学原理与深入理解

详解TensorFlow™ GPU 安装

fastText原理及实践

中国科学技术大学计算机学院课程资源:USTC-CS-Courses-Resource

那些值得推荐和收藏的线性代数学习资源

资源关键字

AINLP聊天机器人除了日常搭讪外,还负责回复用户的日常查询,所以为一些关注度比较高的文章和NLP资源做了关键字和索引,分散在以前的一些文章介绍里,这里再统一贴出来:

1、关注AINLP公众号,后台回复 “文章、历史消息、历史、history、存档” 任一关键字获取历史文章存档消息。

2、回复“正态分布,rickjin, 正态分布前世今生, 正态分布文章, 正太分布, 正太, 正态”任一关键字获取Rickjin正态分布前世今生系列:

正态分布系列文章索引

3、回复“nlp, 自然语言处理,学习自然语言处理,学习nlp, 如何学习nlp,如何学习自然语言处理” 任一关键字获取文章: 如何学习自然语言处理

4、回复”slp” 获取:斯坦福NLP书籍和课程网盘链接和密码

5、回复”slp3″ 获取:自然语言处理综论英文版第三版及斯坦福NLP课程链接和密码

6、回复”ng” 获取:Andrew Ng老师课程相关资料链接和密码

7、回复”aic” 获取: AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总

博客版本持续更新,欢迎提供线索: http://www.52nlp.cn/?p=10998

8、回复”bert” 获取: BERT相关论文、文章和代码资源汇总

博客版本持续更新: http://www.52nlp.cn/?p=10870

9、回复”HMM” 获取:HMM学习最佳范例全文PDF

HMM学习最佳范例全文PDF文档及相关文章索引

10、回复”Hinton” 获取:面向机器学习的神经网络公开课视频及课件

Geoffrey Hinton 大神面向机器学习的神经网络公开课及相关视频资料

11、回复”NLTK” 获取: NLTK相关资料

Python自然语言处理工具NLTK学习导引及相关资料

12、回复”youhua”获取:优化相关资料

凸优化及无约束最优化相关资料

13、回复”xiandai”获取:线性代数相关资料

那些值得推荐和收藏的线性代数学习资源

15、回复”kuakua”获取:夸夸语料库(500条)

为了夸夸聊天机器人,爬了一份夸夸语料库

16、回复”fenci”获取:中文分词相关资源

中文分词文章索引和分词数据资源分享

17、回复”tongjixuexi”获取:李航老师统计学习方法第一版PPT(清华大学深圳研究生院袁春老师精心制作)

李航老师《统计学习方法(第二版)》出版及统计学习方法第一版PPT课件下载

18、回复”nmt”获取: Philipp Koehn大神的神经网络机器翻译学习资料:NMT Book

另外我们建立了几个微信群,围绕招聘、求职、技术、竞赛交流相关主题,感兴趣的同学可以添加微信AINLP2或者扫描以下二维码,注明关键字,拉你入群: