本博客将简单摘录并总结复旦大学张军平老师的书籍《高质量读研》中的内容, 虽然读研究生这件事对每个人的最优解都是不同的, 但也希望通过读这本书听听过来人的意见.
下面将参考原书中的章节安排进行摘录, 并会附上一些个人的想法, 也欢迎大家分享自己的观点.
时商
- 本节内容来自原书第1、2小节, 以markdown引用格式标注的即为原书语句。
⏱️ 除了智商,一般我们还能想到的还有情商,还有一种经常被忽略的——时商; 时商, 顾名思义就是对个人可支配时间的管理能力和利用效率.
虽然对时间的利用效率很重要, 但也不能忽视必要的 绝对投入时长. 只有投入足够长的时间才有提高利用效率的基础. 书中提到, 对于科研工作者有三方面工作是需要绝对投入时长的: 阅读论文, 做实验, 写论文.
多读论文是逐渐提高时商的必要环节; 利用各种可以想到的时间 “刷” 论文.
根据之前博客所建立的论文流, 只需要一个邮箱客户端, 就可以在等车, 开一些无聊的会议, 排队等空闲的碎片时间快速浏览领域内的最新文献.
以点带面的基础学习; 基础知识应该优先定位在对具体研究方向的前沿把握上
如果自己刚接触某一新领域, 只用明确该领域的基础内容, 例如最常见的算法框架, 符号定义, 定理间的逻辑关系等. 而且可以通过阅读各种综述补全自己对研究问题和挑战的理解, 优先掌握基础知识中的最小可行子集, 来培养自己的快速学习能力.
在阅读中, 如果我们发现自己在公式和理论理解上存在障碍或偏差, 可以再按图索骥地到更基础的教科书或工具书中找答案
要从实际研究或论文里的那些确切知识点出发, 结合教科书等资料实现知识面的扩张, 而不是直接去啃那些大部头, 因为绝大多人最后会边啃边忘 (x. 当我们读这一领域论文的Preliminary部分发现, 一眼扫过绝大部分都是熟悉的理论和公式, 说明已经具备了开展下一步研究的知识基础了.
Presentation与讨论班
- 本节内容来自于原书第 8, 9 小节
️ 充分利用讨论班和写PPT的机会来锻炼自己
很多人都认为开组会和写PPT是一件浪费时间的事情, 但其实这种强迫型的”输出”工作可以帮助我们更好地理清思路, 甚至能帮助我们想到一些没想到的问题. 因此, 在时间允许的情况下, 我个人觉得还是要抓住这种比较正式的, 可以强迫自己输出的机会.
PPT里一图胜过千言万语, 多讲实例; 学术报告有的时候也可以像脱口秀, 适当加入调动听众情绪的元素; 在讲到比较难的概念时, 可通过打比方的方式讲解
制作PPT并不困难, 而制作清晰易懂的PPT并给出逻辑通畅的讲演却是一件很不容易做到的事. “如何让别人快速明白你在说什么”这件事会出现在生活工作的方方面面, 而这种能力也是需要锻炼的, 因为这不仅适用于研究生期间的组会报告, 也适用于以后工作中的各个环节.
❓ 一般不敢主动或率先问问题, 生怕问得太浅显了被大家笑话, 于是干脆 “多一事不如少一事”.
导师所采取的组会或者讨论班 (Seminar) 是了解所有学生的个人状态与问题最直接的形式, 因此这种形式对于学生个人而言, 也是很好的能接触其他同伴情况资源和见解的宝贵机会. 在会上作报告时, 不仅自己要能主动发现别人 presentation中的问题, 而自己在 presentation 时也需要思考其他方向的研究人员可能会问哪些地方.
同时, 可以利用这个大家齐聚一堂的机会, 多提出一些 “raw idea”, 多进行一些实时的讨论. 这种思维上的交锋在很多时候是有助于让自己打开思想上的局限.
️ 鼓励研究生多多细推报告论文里的公式, 既有利于学生对问题的理解和提升临场反应能力, 也能帮助台下学生看出论文的创新点和潜在研究方向
相信大家都有体会, 在台上当场推导或演算的定理或公式通常会印象更深一些; 同时, 自己在推导过程中, 也能帮助台下的同学跟上思路. 不论是台上推公式, 还是在组会上实时讨论, 都可以加深对某些知识点或者研究问题的理解.
♂️ 学生也应该培养自行管理和组织讨论班的习惯和能力
虽然这一点感觉对我以及对大多数同学而言可能的确比较难做到, 但是自己也应发挥自己的主观能动性, 可以与周围同学或是同一研究课题的同学主动讨论, 主动研究. 否则自己一个人闭门造车会忽视很多潜在问题.
论文撰写
- 本部分内容来自于原书11, 12, 13, 14, 16, 17, 18, 19 小节
题目和摘要
️ 比如通过看论文题目来判断其是否具有创新性, 推测作者可能的研究思路
在我们泛读一些论文时, 摘要和结论固然是阅读时最首要的两个部分, 但有时候其实只从题目用语以及题目的句子构造中就能一窥作者动机和文章重心, 尤其是面对大量的同类文章需要阅读时, 就能通过题目先对文章快速给一个初步的印象分. 而其他人的文章题目看多了, 其实也有利于我们总结自己论文题目的能力.
✨ 论文的标题不仅能反映本研究组对方向先进性的把握, 而且在一定程度上也决定了论文被录取的概率和审稿周期
很多时候, 编辑部给审稿专家的审稿依据中就有一个问题是, 这篇论文的题目是否符合要求 (Satisfactory) ” />比摘要还会先被别人看到的内容.
多数情况下, 评审专家仅仅根据论文的标题来决定是迫切想审还是无所谓; 从编委的角度看, 好的论文标题是那种自带热点方向关键词的
CS领域的很多论文其实都有一些挺花哨的题目 (顶会论文尤甚), 比如大名鼎鼎的 Attention is all you need. 诚然, 要起个这种抓人眼球并且契合文章主题的题目对于我们这样的非英语母语者还是有困难的. 但是在每次遇到这样的题目时可以将这些短句记录下来, 这些”花哨”的短句看得多了, 自己其实也可以很快地构思出来.
摘要部分涉及的研究任务的理论和实际应用价值过于一般, 评审可能会从审美疲劳的角度先验地来扣分. 套路式用语, 也容易让评审看到作者单词量的匮乏
对存在问题的总结和思考的陈述, 则是评审和投稿者在研究上的一次双方品味的匹配
在许多文章中都会有一节是Problem Statement 或者 Research Questions, 我个人而言也比较喜欢这种做法. 因为这样会让审稿人清晰明了地看到这篇文章要解决的问题是什么. 所以与其散落在introduction中等审稿人去总结, 不如我们直接总结好然后给审稿人看. 这不仅能体现自己的研究能力, 也是让审稿人能快速了解这篇工作的研究价值.
️ 论文中关键词的用途是, 帮助编委快速找到跟论文研究内容相吻合的评审专家
关键词不一定非要选摘要中的原词 (如果是原词那最好), 但一定要和自己文章的topic紧密相连, 这些关键词是帮助编辑快速定位和邀请到匹配的审稿人的关键. 毕竟大家都希望自己的工作能让真正接触这个领域的专家去评审. 因此, 这4-5个关键词一定要仔细挑选.
概述和相关工作
️ 过长的现状概述 (Introduction和 Related Work) 会增加不必要的阅读时长, 妨碍评审专家和读者快速过渡到论文的核心内容, 也容易导致他们抓不住重点, 甚至引发不耐烦的情绪
一般而言, introduction 最好能在文章的第一页内就结束, 而related work也可以分为几个subsection的结构有机地组织不同方向的同类工作. 总之, 这两个小节虽然起到了给全文进行逻辑铺陈和立论的关键作用, 但也不能变得 “又臭又长”, 让读者抓不到文字的重心.
♻️ 提及的贡献点或创新点应该是用来解决文中存在的问题, 从而形成逻辑闭环
这一点乍一想会觉得 “这么自然的事, 我写论文的时候肯定不会忘记” ; 但实际中我们写着写着其实很容易就忘了上下文之间的逻辑对应关系. 因此还是要多注意下.
综述部分 (Related Work) 的内容要切题, 从各个侧面突显论文的贡献
在综述部分切忌进行漫无目的的文献堆积, 因为这种堆积恰恰反映出的是对研究重点和研究问题, 以及对研究现状的不清晰. 说白了, 会给审稿人一种”入行了, 但没完全入”的感觉. 这里在写作时一方面要准确概括出这些文献本身的特点, 即要回答”凭什么我们要在这里列这些工作“这个问题; 另一方面, 也要体现出对自己工作特色的精准把握, 即要回答 “凭什么自己的工作要比他们好“这个问题.
写综述论文时尤其把前瞻性和领悟挑出来, 要有独特的思考, 而不是简单的知识罗列和流水账
虽然我们作为学生很少有写综述论文的机会 (因为一般是由业界大牛来亲自操刀一篇综述), 但是我们在读别人的综述论文时, 除了通过参考文献查缺补漏自己的论文库之外, 还要多去注意作者有关这一方向的洞察 (insight), 这些其实才是一篇综述真正有意义的部分.
创新
➕ 很多顶级论文的创新点并不多, 甚至有时候可以归结为只有一两个公式的改进
AI与CV相关领域的论文我了解不多, 但是在安全四大上发的文章, 创新点和工作量都是量大管饱的. 但不论是哪个领域, 一篇好的论文必然都需要在某几个技术点上进行深挖, 理论工作和实验验证都需要做的很透才有机会让审稿人认可这篇文章的价值.
✖ 启发式策略获得的方法创新最好用公式表达; 如果自己的理论水平没有达到一定程度, 千万不要过分自信, 因为可能碰到基础好的多的审稿人; 滥用和重复定义符号都会让评审觉得作者不专业
对于密码学相关的文章, 一定要仔细斟酌所用符号, 要尽可能与同行使用相同的记号法, 减少审稿人的阅读负担, 有利于让审稿人认可我们工作的专业性.
顶级会议或期刊只要投稿就说明工作有一定意义了, 而这些刊物的评审往往会给出翔实的建议或评论, 这些建议就已经非常有价值了
并不要害怕拒稿, 这几乎是每一个博士生都会遇到的事情 (拒多了人就麻了. 在与审稿人和编辑的每一次交锋中, 都需要大方承认自己的问题并加以修正, 因为这都是完善我们工作的很好的机会.
如果审稿人很熟悉这个领域的工作, 那么他往往会针对一些很确切细致的点; 如果审稿人不是很熟悉这个领域, 他也能以一个外行的角度帮助我们发现论文中那些难以理解, 逻辑不顺畅 的地方.
完备的实验
实验中尽可能让主观的指标尽可能客观化
论文提出的方法或创新点是否都通过实验充分反映了
对于这一点, 要记得我们在introduction中写出的文章创新点和贡献有哪些, 那些点又是否能和这里的实验结果匹配上. 这样逻辑才更加完整, 说服力也才更强.
实验结果的问题或不足, 只要能解释清楚, 反而能增加评审和读者对论文的信任
一个方案不可能没有缺点, 但也不可能没有优点. 在写论文时还是要尽可能坦诚地讨论自身方案的缺点, 能将造成这一缺陷的根本原因向读者阐释清楚; 而且通常而言, 这些缺点其实正是方案优点的副产物, 只要言之有理, 让读者能感受到自己对自身方案的根本动机和核心原理有充足的把握.
结论与参考文献
结尾要逻辑闭环, 不能虎头蛇尾; “重要的事说三遍”
这两点跟上面一样, 结尾更是要能呼应前文并且给出一些确定性的结论. 如果说摘要是对整篇文章的浓缩, 那么结论就是不仅要做到浓缩, 还要做到像给领导汇报工作 一样, 直截了当地给出文章的核心观点.
可主动提出论文中的不足之处, 比如自己方法可能存在的小局限
在结论中, 避免无意地夸大了自己成果性能和可扩展性; 存在一个平衡: 既不能过分吹嘘, 无中生有, 也不能过分低调
参考文献是许多评审最喜欢先看的地方, 以对作者的科研修养作初步印象; 不要将一些低水平的文章或会议列入参考文献中
虽然在写作顺序上, 参考文献一般是我们最后才会去完整检查与核对的地方, 但对于审稿人和很多专家而言, 他们很多时候会先扫一眼参考文献. 一方面, 通过观察参考文献的格式规范和排版, 就能对文章作者的排版习惯有一个初步印象; 另一方面, 在浏览过程中如果可以很轻松地发现不少自己熟悉的论文题目, 说明这篇文章的作者最起码是”懂行”的.
引用中作者姓名格式的一致性, 注意中国人和外国人的姓与名顺序
LaTeX的bib文件中, 约定俗成的大写名词要用花括号 {} 含起来
如果引用页数从1开头要注意检查和溯源原始论文在刊物集中的正确页数
arXiv等预印平台上的论文在引用时需注意是否已经有了公开发表的版本
这些细节问题在检查参考文献的引用时都应重点关注 (尤其是大写名词在参考文献中变小写的问题 ). 而如果有的文献是arxiv上的, 一定要重新反问下自己, “这篇文献是否有足够的依据让我引用它”, 即要么 (1) 它有在正式刊物上经过同行评议过的版本 (那么我们就该换成这版) 或者 (2) 在arxiv上已经有了较高的引用量. 这类预印版文章未经过校对和审查, 其中某些结论如果有问题, 也会影响自己工作的正确性.
撰写论文是培养研究生完美主义情操的必经环节, 对细节的完美追求需要变成下意识的习惯
参考文献是整篇论文中一块不太起眼的地方, 但也正是因为他的不起眼, 才会反映出作者团队在研究和撰写论文时的一些下意识行为. 因此, 大家都应对这个”阿克琉斯之踵”仔细检查, 毕竟需要的也只是耐心.
完美主义排版
通过论文的排版, 也能判断出论文大致的水平
一篇论文本质上就是在做”delivering”, 有讲故事这个层次上的”delivering”, 也有方法原理与结果验证整个层次上的”delivering”, 还有不可忽视的, 这个文稿本身可读性与规范上的”delivering”.
紧凑有序, 风格统一的论文可以让人光是看到PDF就赞叹不已; “犬牙交错”, 各处留白的论文让人也会一下失去了阅读的兴趣. 虽然在LaTeX的帮助下, 绝大多数人都可以排出有一定下限的文章, 但是稿件中的很多排版细节仍然需要我们以”完美主义”的心态去处理.
表格之间的内容切忌重复
数学公式里的括号要勤用\left 和 \right
文章的布局也需要精细化调整, 如调整图表的大小位置, 精简不必要的文字
用LaTeX排版的过程中其实会遇到比上面三点更复杂, 更需要关注的的问题. 越是有”算了好麻烦, 就这样吧”的心态, 就是越要能咬住牙刨根问底, 以完美主义的心态去完成排版, 这样才能给予编辑和审稿人以良好的第一印象.
审稿意见
论文存在较大问题时, 一般会有以下理由:
1. 缺乏近三年新方法的实验比较
2. 缺乏对重要文章的引用和综述
3. 方法存在关键性漏洞 (创新是通过牺牲某些关键指标获得的)
4. 缺乏洞察力, 论文有记流水账的嫌疑
5. 重大学术问题 (一稿多投, 抄袭等)
个人感觉其中3和4是最为常见的, 比如审稿人会觉得我们的工作是incremental的, 也就是这个结论或方法没什么insight. 在保证了工作质量的前提下, 出现这种情况说明论文在表述上依然有问题, 要么是文章的立论部分, 要么是实验结果的评估部分. 但这个时候绝不能认为审稿人不懂行在瞎问 (虽然小概率确实会这样), 而是要换位思考下, 仔细剖析下审稿人为什么拿到这篇论文后的内心世界 , 要有针对性地回答.
♂️ 评审最不希望看到的是, 作者不标注哪里改了, 也不告知都改了哪些内容
一般在Response letter中, 不仅需要解答审稿人的问题, 还需要准确告知文中哪些地方的修改提现了对这个问题的解答. 只回答问题, 不告诉文稿里具体修改的地方, 也是会很让人恼火的.
一定要正面回应评审提出的问题
如果敷衍了事和逃避对核心问题的回答, 较真的评审可能会因此而拒掉稿件
Response letter中对于审稿人的每一个问题 (甚至每一个观点) 都应作出正面回应, 赞同的话按照意见修改好拍拍马屁, 不赞同的话要详细说出原因, 并且要从客观逻辑的角度进行辩论, 最好不要从”做不了”, “没条件”, “现在也挺好的”这种主观想法来敷衍. 整个审稿和Rebuttal的过程就是双方思维上的交锋, 所以不要想着耍小聪明去诡辩.
期刊论文会有一个致谢小节, 专门感谢评审和编委的工作
Acknowledgement 里的这种客套话不要忘了, 有总比没有强.
心理暗示与好奇心
- 本小节内容来自于原书22, 23, 24, 25小节.
♂️ 后浪要有强烈学习新知识的欲望, 且不应害怕失败, 科研有较大的不确定性, 一项研究的失败概率也不低
稚晖君的时间管理方式是将任务划分为主线任务和支线任务, 然后根据关键节点去分配和规划时间. 所以, 我们也可以将自己的手头任务分为主线和支线, 主线就是我们的科研与实验室任务, 支线就是我们自己想学想做的各种技术和项目. 这些支线任务的目的就是, 让我们始终拥有对新技术和新知识的好奇心和学习能力, 而不单单局限于自己科研上的技术栈, 这只会让自己手里的牌越打越少. 而且支线中的技能有时候甚至可以反哺主线科研任务的推进.
冷门方向得不到广泛关注, 发表的论文甚至长时间只有0次引用
冷门方向 不等于 没意义的方向. 很多冷门方向之所以冷门, 恰恰是因为长时间没有突破性成果, 如果自己的工作能抛砖引玉促进突破性成果的产出, 也算是一点微小的贡献. 虽然马太效应在学术研究中也是适用的, 但在能保证自己毕业的前提下, 还是要多挑战一些别人不敢挑战的事情. 多去挖坑, 而非填坑.
✊ 多给一些正面暗示, 就更容易成功
“挑战极限”
自律拉大了差距
适量鸡汤, 有益心理健康
能做的动科研的时候, 就少掺和其他事情
科研中事情大多都是智力密集型而非劳动密集型的, 因此往往需要投入一些连续的纯粹时间, 比如在某一项工作或几个问题上专门投入连续的2-3个小时去解决. 这样往往有比较好的思维连续性和深度思考. 如果将科研时间也碎片化, 那么有时候工作的正确性和一致性甚至都无法保证.
如果对于提出的问题立马就能知道答案, 那这就不是一个好的, 有深度的问题
但是任何有深度的问题都是从简单的问题不断深入而得到的, 在团队合作或者自己探索时, 一定要多提问题, 这样才能激发大家的进一步思考.
对细节的完美追求, 要成为研究生生涯中的潜意识反应
对研究成果做吹毛求疵的雕琢
细节! 细节! 还是那些细节!
学术诚信
避免内卷的研究方式, 即将简单科研任务”复杂化” 却无实质性的进展
实验室同门之间难免会遇到利益冲突的事情, 这个时候一定不能陷入内卷式的思维方式, 而是要以一种资源重组的思维看待彼此的关系. 要尽可能去扩大资源池 , 也就是多想些idea和潜在方向让大家都有论文发, 而不是就只看到这一个idea, 这一篇论文, 最后为了争那个第一作者搞得你死我活.
避免内卷后的学术诚信风险
自己在写论文时, 切忌直接抄袭了其他论文中的漂亮语句
人一旦陷入内卷式的思维模式, 对很多事情的认知也会发生扭曲, 此时会作出很多意想不到的事情. 不过在生活中, 这些”意想不到”的事情基本也都处于灰色地带; 然而在学术研究中, 这些事情很多都是违背学术诚信与学术道德的, 比如直接搬运其他论文中的漂亮语句. 虽然问题没那么严重, 但一旦被编辑或审稿人发现了这一点, 就会是一个”破坏底线”的研究行为.
最后
非常感谢各位能看完我写的这些废话, 这本书除了上面涉及的章节外, 还有《寻找导师》, 《科研与应用》, 《热门与冷门研究方向》, 《爱好与科研》等内容. 阅读本书的过程不会感到枯燥, 个人认为这本书写到的很多事情都是非常实际的, 甚至很多都是只有内行人才能理解的点.
尽管读完《高质量读研》 并不能让自己立马成为一名高质量研究生, 但起码也了解了成为一名高质量研究生需要付出的努力. 最后, 感谢你的阅读, 以一句歌词作为结束:
“无人生哲理能急救你, 唯独这歌赠你 ”——容祖儿《心之科学》