论文太难读怎么办？试试用这五个方法助你理解

2010 年 12 月 26 日

悄悄告诉你几个窍门。

痛苦

做科研，不能不读论文。但是，我见过不少研究生，论文都读得愁眉苦脸的。

这其中，自然有因为拖延的关系。例如教授布置了 2 周后讨论论文，你原本可以每天抽出时间，慢慢消化。可你非得拖到截止日期的前一天晚上才打开看，希望毕其功于一役……这显然是 态度问题 。

但是，不可忽略的，有些同学，却真的不是态度问题，而是方法不当。

他们喜欢跟论文死磕。读不懂，就一遍一遍反复读，试图从字里行间，悟出精髓。

这可能是为了遵从那句古训：

书读百遍，其义自见。

且不说这样是不是最终能走通。只论这个过程，就很痛苦，而且事倍功半。

有的同学对着一篇论文发愤了几天甚至是几周，依然看不懂。那种挫折、沮丧，别人看着都难受。

问题出在哪里呢？

困难

我在《如何与导师有效沟通你的论文选题？》一文给你讲过，一篇合格的论文，就是传递认知差的载体。

更进一步，不断涌现的论文，其实就是学术界的升级安装包。

你不断读论文，就是为了跟学术共同体 保持同步 。但是，只有你跟这篇论文所依赖的那些基础知识同步以后，安装这个升级包才有意义，也才能水到渠成。

而对着论文犯愁的你，不管出于什么原因，显然不大具备这个新包儿（论文）的安装条件。

所以，你需要做的，不是跟这篇论文自身较劲。而是应该尽快补充调整自己的知识架构，使得这篇论文对你而言，是可以兼容，并且升级的。

论文罗列的参考文献，可以作为你补充基础知识的一个有效手段。毕竟，作者亲自在这里为你指明的路径，如同给了你一张写有路标的迷宫地图。

这就是为什么，许多优秀的博士，都是要读数百篇文献的。读过那些文献以后，再看什么新文献，都会很有感觉，一下子就能找到方向，看到论文的优势和弱点。

这时候，你就已经是个 专业人士 了。但是，对于初学者而言，你得先让自己树立自信。而不是用一种近乎于闭卷考试的方法挑战自己。

做买卖不怕赔钱，但是怕刚开张的时候赔钱。这是有道理的，因为「贫穷陷阱」曲线有多个均衡。

同样，做科研也不怕面对困难。但是初始阶段，还是得给自己降低一些难度。

许多时候，你要读的论文来自陌生领域，你并没有那么多的时间，一篇篇文献去啃、去挖掘。

举个例子，假设你的研究方向，不是自然语言处理或者深度神经网络。但是你最近在学术研讨会上听说了一个神奇的东西，叫做 BERT 。

你自己学科里面的很多人，都在谈论他。他们用上了 BERT ，所以可以高精度、自动化处理很多从前只有人类才能做好的文本处理工作，例如情感分析，例如智能问答等。

见他们发了很好的论文，你也想一探究竟。

你找到了 BERT 的原始论文，它就在预印本平台 arxiv 上面。

但是一打开，你就晕了。

这些术语（例如 fine-tuning），这些图，都是什么意思啊？一点头绪都没有。

怎么办？

好在，要读懂论文，是有不少窍门的。你可以善用许多从前忽视的资源，帮助自己消化和理解论文中令你感到困惑的部分。

下面我一一讲给你听。

幻灯

俗话说，解铃还须系铃人。

如果你觉得一个作者在论文中使用了很多公式，而且表达晦涩，那是因为要发表，他只需要顾及审稿人和领域内小圈子专业人士的感觉就可以了。为了表达效率高，他就得用术语。为了表达精准，他就得用公式。用术语，就是压缩；用公式，就是加密。

所以，论文其实就是一个加密压缩包。

它安全，只有内行看得懂，不会引来很多外行抬杠。它高效，压缩了所有冗余的信息。

但这搞得你这个初学者读不懂，很不愉快。你得先解密再解压缩，然后才能看懂。可你症结在于，你不具备解密和解压的能力。好在，每一个作者，都要同时面对两个问题—— 共识与 知名度 。

共识是说，别人承认他；知名度是说，别人喜欢他。要提升知名度，他就不能只闷头写论文。还得出席一些会议，做做报告和讲座什么的。面对大领域同行，他要把一个事儿说清楚，就不能再用那么多的术语了，而必须考虑到听众的感受。这时候，他可能更多使用描述性语言，生动的例子，甚至更吸引人的内容，例如视频或者动图。

这些会议的幻灯，很多都是 公开发布 的。所以你不妨搜搜看。

例如说，你在搜索引擎里面搜索 BERT 那篇论文的第一作者，加上 BERT 这个关键词，以及把资源类型指定为 ppt 之后，你就能看见很有趣的搜索结果了。

点开看看？

原来是 Jacob Devlin 在斯坦福大学一次演讲的幻灯。

这里面，清晰地定义了问题，并且梳理了各种疑问的解答。

特别地，还使用了更多的图形，来对比 BERT 和现有技术之间的差异。

通过幻灯，你可以把论文中很多没有能够展开的问题，或者许多作者认为小领域同行默知默会的知识点，都详细论述。

有了这些补充资源，再回去读论文，是不是更加清晰了？

博客

如果找不到作者的演示幻灯，或者看了作者的幻灯之后，你还是没能很好理解论文的内容，也不必气馁。

我们前面说的，只是通则。

例如我们假定，作者面对一群不同背景的听众时，他的幻灯会做得更加深入浅出，以调众口。

但是，有些学者，就是不分场合跟你展示数学功底。指着一个包含超过 30 个数学符号的长式子兴奋地说：

看，就是那么显而易见……！

这种情况下，如果他的工作足够重要，你不必担心，会有人站出来帮忙做解密和解压，也就是「科普」这件事儿的。

目前学术界有几个科普文和教程聚居地。其中我最喜欢的一个，是 medium.com 。

BERT 论文出来之后不久，你就可以在 Medium 上面查到这篇博文。

博文写得如何？看看点赞（clap）次数也就知道了。

标红的地方显示，已经有超过 3800 人点赞了。这在 Medium 平台的学术科普类文章里，算是非常受欢迎了。

之后过了半个月，又有人写了这篇：

随后，因为许多与 BERT 类似的 Transformers 模型竞相出现，所以 medium 平台上的相关系列教程，也层出不穷。

例如发布在 2019 年 2 月 How the Embedding Layers in BERT Were Implemented 一文中的这张手绘图形，就把 BERT 为什么使用 3 种不同的嵌入层，讲得一清二楚。

这些文章，可以让你从一个感兴趣的旁观者角度，迅速建立相关概念。有了这些基础之后，再去读论文，你的感觉会轻松许多。

视频

如果你足够幸运的话，还能找到很好的视频教程，作为补充资源。

其中许多视频，还是免费的。

例如 BERT ，就有不少人一言不合发视频给大家讲讲清楚。

中英文视频都有。而且排名靠前的这些教程，往往都做得品质精良，让你迅速了解 BERT 的来龙去脉。

我个人比较推荐那些 大学老师做的视频 。当老师受到的最宝贵训练，绝不是什么师资班的培训，而是上课的时候收获的学生反馈。

因为总是给学生上课，他会明白学生的关注点在哪里，会忽视或者错误理解什么，从而可以有的放矢强调某些东西，让你轻易避开很多认知误区陷阱。

例如说李宏毅老师讲的 BERT 介绍，就可称得上是深入浅出，形象生动。

何况，还是中文的。

课程

有的时候，你会发现，虽然某些令许多人关注的焦点内容（例如 BERT ）会有这样多的视频可供观赏，但是若你想仔细了解一下论文里出现的其他技术，以便对比，就未必有这么好的运气了。

在视频平台上搜寻，也许很难有收获，甚至还会找到很多噪声。

这时候，你也不要气馁。虽然你想看视频教程，但如果只在某个视频平台搜索，那就如同鱼在坑的东边，你却非得在坑西边钓一样。

系统化了的知识，你没有必要东奔西走地查找。而是可以通过在线课程来快速概览。这样不仅选择成本低，而且学习效率更高。

有的同学天然把课程等同于几大 MOOC 平台。实际上，这也是一种误解。

例如你打算回顾一下，自然语言处理近几年的发展与技术应用。那么，选择 Coursera 或者 Udacity 课程，自然也是一种办法。

但你如果喜欢更灵活地学习，可以直接到 fast.ai 上面。因为这里的特点是快速迭代，紧贴前沿，而且刚好就有一门 NLP 课程，内容非常新颖。

课程内容里，自然也包括 BERT 。

而与此同时，它也囊括了 ULMfit，GPT-2 和 XLNet 等相关技术。以写代码来理解不同技术的进展，逻辑清晰，让你一站式了解领域里面最重要的内容有哪些，特别是最近发生了什么有意思的事儿。

代码

提到了代码，咱们就多说几句。

Jeremy Howard 在他的课程里面一直强调，对于技术类的问题，代码比公式更重要。

描述一个算法，你用公式当然没有问题。但如你能把它写成代码，而且正确运行，那想必你是 真的懂了 。

同样，现在我们看很多论文，都配有代码。

如果你读论文的时候，只阅读公式看算法，搞不懂究竟是怎么回事儿，则完全可以去看看那简单的 Python 代码。

例如说 BERT ，你虽然看到各种图片，但是可能还是不知道，如果你打算做一个分类下游任务，该怎么给你的输入文本做编码呢？

这时候，如果你读代码，效果就大不相同了。

当然，这里不是让你去读最初论文的代码。那是基于 TensorFlow 1.x 版本写的。回顾一下，我在《如何用 Python 和 BERT 做中文文本二元分类？》里面，跟你介绍过 TensorFlow 1.x 设计上的反人性。

你完全可以去读 PyTorch 代码。至少读起来，更像是人话。

有好事者，就把 TensorFlow 上的各种 Transformer 模型，都搬到了 PyTorch 上。目前这个叫做 Transformer 2.0 项目，在 Github 上已经有了 16300 颗星。

在论文里， BERT 模型输入文本的预处理，是这个样子的。你可能会很疑惑，特殊的 token （例如论文中出现的 [CLS] 和 [SEP] ），究竟如何设置，如何起作用？

这里，看一下代码示例。你会发现，原来你该这样把它们加入进去。

而且，只有真正看了代码仓库里面的示例，你才会了解， transformers 这个项目，为什么会这么火。

因为，你可以仅仅用十几条语句，就完成一个经典的文本分类任务。

于是，你也就明白，在自己的研究任务里面，用上最前沿的自然语言处理技术，根本就没有预想得那么困难。

小结

本文我们以 BERT 为例，为你讲述了当直接阅读科研论文时遭遇困难的原因，以及你可以求助的免费资源和路径，它们包括但不限于：

幻灯。作者用幻灯和听众沟通的时候，是要在一定程度上，放弃术语和公式的便利的。这就给你一个听懂的机会。
博客。对于一个大家都认为有用，但是学起来很困难的知识点。你可以在主流技术博客平台上找一找，很可能会有惊喜。
视频。视频教程的好处，是可以用更为形象生动的方式，给你展现动态的过程。而且，有时你还能直接感受到讲者的幽默。
课程。如果你需要形成知识基础，系统化的课程可以让这一过程快捷高效。
代码。对于那些技术性的问题，数学描述算法有时候会让人有疑惑。这时候，阅读源代码，甚至编程实践出来，会极大提升你的理解程度。

当然，这不是全部。

最好的方式，当然是与专家甚至是作者本人，做面对面的高效沟通反馈。当然，这样的机会很稀缺。如果你遇到，一定要抓住。

专栏

告诉你一个 好消息 。

我在少数派的第一个订阅专栏《科研新手全面入坑指南》已正式上线了。

这是我对科研方法与工具类文章的汇总、梳理与升级。之前的文章，我用文内和文末链接的方式，帮你找寻相关内容和前导知识。但是，这样读者很容易迷失在链接的网络中，难以形成系统化的知识和技能架构。

少数派发现了这个痛点，并且和我一起，投入了大量的精力解决它。

文章的排布，是我和编辑团队重新修整和梳理过的。专业的编辑和美工帮我把它们变得更加紧凑、逻辑化，也更美观和有趣。

我用 20 多篇教程，为你介绍初窥研究门径的研究生与高年级的本科生，很需要了解的一些科研基础知识。包括但不限于如何选题、如何读文献、如何快速写初稿……这些知识，你的导师大约会默认你已经学会，因此不会手把手教给你。但是你若做不到，导师很可能会觉得你基础不牢，或者不用心。你唯一能做的，就是尽快把它们补充齐备，以便减轻刚刚走上科研之路时的痛苦，保护好你的好奇心与成就感。

除了方法，我还介绍一些工具给你。例如 VOSViewer 。它可以帮助你快速扫描中英文领域文献，发现作者、主题之间的微妙关联。由此，你就可以快速识别已有研究的盲点、盲区，甚至是盲维，从而有的放矢地找到自己研究的独特定位与价值。

如果你正在发愁毕业论文该怎么着手做，那么这是个很好的 入手时机 。

愿热爱学习的你，科研之路从此走得更加扎实与顺畅。

读过本文，如果觉得有收获，请点赞。

如果本文对你身边的亲友有帮助，也欢迎你把本文通过微博或朋友圈分享给他们。

M	T	W	T	F	S	S
« Jan
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

演道网

论文太难读怎么办？试试用这五个方法助你理解

痛苦

困难

幻灯

博客

视频

课程

代码

小结

专栏

延伸阅读

About The Author

bjmayor

痛苦

困难

幻灯

博客

视频

课程

代码

小结

专栏

延伸阅读

Related Posts

About The Author

bjmayor