来自MIT人工智能实验室:如何做研究?
作者:人工智能实验室全体研究生
编辑:David Chapman
版本:1.3
时间:1988年9月
译者:柳泉波 北京师范大学信息学院2000级博士生
摘要 本文的主旨是解释如何做研究。我们提供的这些建议,对做研究本身(阅读、
写作和程序设计),理解研究过程以及开始热爱研究(方法论、选题、选导师和情感
因素),都是极具价值的。
Copyright 1987, 1988 作者版权所有
备注:人工智能实验室的Working Papers用于内部交流,包含的信息由于过于初步或
者过于详细而无法发表。不像正式论文那样,会列出所有的参考文献。
1. 简介
并没有什么神丹妙药可以保证在研究中取得成功,本文只是列举了一些可能会有所帮
助的非正式意见。
目标读者是谁?
本文档主要是为MIT人工智能实验室新入学的研究生而写,但对于其他机构的人工智
能研究者也很有价值。即使不是人工智能领域的研究者,也可以从中发现对自己有价
值的部分。
如何使用?
要精读完本文,太长了一些,最好是采用浏览的方式。很多人觉得下面的方法很
有效:先快速通读一遍,然后选取其中与自己当前研究项目有关的部分仔细研究。
本文档被粗略地分为两部分。第一部分涉及研究者所需具备的各种技能:阅读,
写作和程序设计,等等。第二部分讨论研究过程本身:研究究竟是怎么回事,如何做
研究,如何选题和选导师,如何考虑研究中的情感因素。很多读者反映,从长远看,
第二部分比第一部分更有价值,也更让人感兴趣。
如何通过阅读打好AI研究的基础。列举了重要的AI期刊,并给出了一些阅读的诀窍。
如何成为AI研究领域的一员:与相关人员保持联系,他们可以使你
保持对研究前沿的跟踪,知道应该读什么材料。
学习AI相关领域的知识。对几个领域都有基本的理解,对于一个或者两个领域要精
通。
如何做研究笔记。
如何写期刊论文和毕业论文。如何为草稿写评审意见,如何利用别
人的评审意见。如何发表论文。
如何做研究报告。
是有关程序设计的。AI程序设计与平常大家习惯的程序设计有所不同。
有关研究生涯最重要的问题,如何选导师。不同的导师具有不同的
风格,本节的意见有助于你找到合适的导师。导师是你必须了解如何利用的资源。
关于毕业论文。毕业论文将占据研究生生涯的大部分时间,本部
分涉及如何选题,以及如何避免浪费时间。
有关研究方法论,尚未完成。
或许是最重要的一节:涉及研究过程中的情感因素,包括如何面
对失败,如何设定目标,如何避免不安全感,保持自信,享受快乐。
2. 阅读
很多研究人员花一半的时间阅读文献。从别人的工作中可以很快地学到很多东西
。本节讨论的是AI中的阅读,在第四小节将论述其他主题相关的阅读。
阅读文献,始于今日。一旦你开始写作论文,就没有多少时间了,那时的阅读主
要集中于论文主题相关的文献。在研究生的头两年,大部分的时间要用于做课程作业
和打基础。此时,阅读课本和出版的期刊文章就可以了。(以后,你将主要阅读文章
的草稿,参看小节三)。
在本领域打下坚实的基础所需要的阅读量,是令人望而却步的。但既然AI只是一
个很小的研究领域,因此你仍然可以花几年的时间阅读本领域已出版的数量众多论文
中最本质的那部分。一个有用的小技巧是首先找出那些最本质的论文。此时可以参考
一些有用的书目:例如研究生课程表,其他学校(主要是斯坦福大学)研究生录取程
序的建议阅读列表,这些可以让你有一些初步的印象。如果你对AI的某个子领域感兴
趣,向该领域的高年级研究生请教本领域最重要的十篇论文是什么,如果可以,借过
来复印。最近,出现了很多精心编辑的有关某个子领域的论文集,尤其是
Morgan-Kauffman出版的。
AI实验室有三种内部出版物系列:Working Papers,Memos和Technical Reports
,正式的程度依次增加,在八层的架子上可以找到。回顾最近几年的出版物,将那些
非常感兴趣的复制下来。这不仅是由于其中很多都是意义重大的论文,对于了解实验
室成员的工作进展也是很重要的。
有关AI的期刊有很多,幸运的是,只有一部分是值得看的。最核心的期刊是
Artificial Intelligence,也有写作"the Journal of Artificial Intelligence
"或者"AIJ"的。AI领域真正具备价值的论文最终都会投往AIJ,因此值得浏览每一年
每一期的AIJ;但是该期刊也有很多论文让人心烦。Computational Intelligence是
另外一本值得一看的期刊。Cognitive Science也出版很多意义重大的AI论文。
Machine Learning是机器学习领域最重要的资源。IEEE PAMI(Pattern Analysis
and Machine Intelligence)是最好的有关视觉的期刊,每期都有两三篇有价值的论
文。International Journal of Computer Vision(IJCV)是最新创办的,到目前为
止还是有价值的。Robotics Research的文章主要是关于动力学的,有时候也有划时代
的智能机器人论文。IEEE Robotics and Automation偶尔有好文章。
每年都应该去所在学校的计算机科学图书馆(在MIT的Tech Square的一层),翻
阅其他院校出版的AI技术报告,并选出自己感兴趣的仔细加以阅读。
阅读论文是需要练习的技能。不可能完整地阅读所有的论文。阅读论文可分为三
个阶段:第一阶段是看论文中是否有感兴趣的东西。AI论文含有摘要,其中可能有内
容的介绍,但是也有可能没有或者总结得不好,因此需要你跳读,这看一点那看一点
,了解作者究竟做了些什么。内容目录(the table of contents)、结论部分
(conclusion)和简介(introduction)是三个重点。如果这些方法都不行,就只好
顺序快速浏览了。一旦搞清楚了论文的大概和创新点,就可以决定是否需要进行第二
阶段了。在第二阶段,要找出论文真正具有内容的部分。很多15页的论文可以重写为
一页左右的篇幅;因此需要你寻找那些真正激动人心的地方,这经常隐藏于某个地方
。论文作者从其工作中所发现的感兴趣的地方,未必是你感兴趣的,反之亦然。最后
,如果觉得该论文确实有价值,返回去通篇精读。
读论文时要牢记一个问题,“我应该如何利用该论文?”“真的像作者宣称的那
样么?”“如果……会发生什么?”。理解论文得到了什么结论并不等同于理解了该
论文。理解论文,就要了解论文的目的,作者所作的选择(很多都是隐含的),假设
和形式化是否可行,论文指出了怎样的方向,论文所涉及领域都有哪些问题,作者的
研究中持续出现的难点模式是什么,论文所表达的策略观点是什么,诸如此类。
将阅读与程序设计联系在一起是很有帮助的。如果你对某个领域感兴趣,在阅读
了一些论文后,试试实现论文中所描述的程序的“玩具”版本。这无疑会加深理解。
可悲的是,很多AI实验室天生就是孤僻的,里面的成员主要阅读和引用自己学校实验
室的工作。要知道,其他的机构具有不同的思考问题的方式,值得去阅读,严肃对待
,并引用它们的工作,即使你认为自己明晓他们的错误所在。
经常会有人递给你一本书或者一篇论文并告诉你应该读读,因为其中有很闪光的
地方且/或可以应用到你的研究工作中。但等你阅读完了,你发现没什么特别闪光的地
方,仅仅是勉强可用而已。于是,困惑就来了,“我哪不对啊?我漏掉什么了吗?”。
实际上,这是因为你的朋友在阅读书或论文时,在头脑中早已形成的一些想法的催化
下,看出了其中对你的研究课题有价值的地方。
3. 建立关系
一两年后,对自己准备从事的子领域已经有了一些想法。此时——或者再早一点
——加入Secret Paper Passing Network是很重要的。这个非正式的组织是人工智能
真正在做什么的反映。引导潮流的工作最终会变成正式发表的论文,但是至少在牛人
完全明白一年之后,也就是说,牛人对新思想的工作至少领先一年。
牛人如何发现新思路的?可能是听自于某次会议,但是最可能来自于Secret Paper
Passing Network。下面是该网络工作的大致情况。Jo Cool有了一个好想法。她将尚
不完整的实现与其他一些工作融合在一起,写了一份草稿论文。她想知道这个想法究
竟怎么样,因此她将论文的拷贝发送给十位朋友并请他们进行评论。朋友们觉得这个
想法很棒,同时也指出了其中的错误之处,然后这些朋友又把论文拷贝给他们各自的
一些朋友,如此继续。几个月后,Jo对之进行了大量修订,并送交给AAAI。六个月后
,该论文以五页的篇幅正式发表(这是AAAI会议录允许的篇幅)。最后Jo开始整理相
关的程序,并写了一个更长的论文(基于在AAAI发表论文得到的反馈)。然后送交给
AI期刊。AI期刊要花大约两年的时间,对论文评审,包括作者对论文修改所花费的时
间,以及相应的出版延迟。因此,理想情况下,Jo的思想最终发表在期刊上需要大约
三年时间。所以牛人很少能从本领域出版的期刊文章中学到什么东西,来得太迟了。
你,也可以成为一个牛人。下面是建立学术关系网的一些诀窍:
有很多讨论某个AI子领域(如连接主义或者视觉)的邮件列表,选择自己
感兴趣的列表加入。
当与很熟悉本领域的人讨论自己的思想时,他们很可能不直接评价你的想
法,而是说:“你读过某某吗?”这并不是一个设问,而是建议你去阅读某份文献,
它很可能与你的想法有关系。如果你还没有读过该文献,从跟你交谈的高手那里得到
该文献的详细信息,或者直接从他那里借一份拷贝下来。
当你读到某份让你感到很兴奋的论文,复印五份送交给对之感兴趣的其他
五个人。他们可能会反馈回来很好的建议。
本实验室有很多针对不同子领域的非正式(持续发展的)论文讨论组,他
们每星期或每两星期聚会一次,对大家阅读完的论文进行讨论。
有些人并不介意别人去翻看他们的书桌,也就是说,去翻阅他们堆在书桌
上的不久要阅读或者经常翻阅的论文。你可以去翻翻看,有没有自己感兴趣的。当然
了,首先要得到主人的许可,要知道有些人确实反感别人翻自己的东西。去试试那些
平易近人的人。
同样,有些人也并不介意你翻看他们的文件柜。实验室中可是有很多学问
精深的人,他们的文件柜里也是有好多宝贝。与利用学校图书馆相比,这通常是更快
更可靠的寻找论文的方式。
只要自己写下了些东西,将草稿的拷贝分发给那些可能感兴趣的人。(这
也有一个潜在的问题:虽然AI领域的剽窃很少,但也确实有。你可以在第一页写上“
请不要影印或者引用”的字样以做部分防范。)大部分人并不会阅读自己收到的大部
分论文,因此如果只有少数人返回评论给你,也不用太在意。你可以如此反复几次—
—这是期刊论文所必需的。注意,除了自己的导师,一般很少将两次以上的草稿送给
同一个人。
当你写完一篇论文后,将论文的拷贝送给那些可能感兴趣的人。别以为人
家自然而然地就会去阅读发表论文的期刊或者会议录。如果是内部的出版物(备忘录
和技术报告)就更不容易读到了。
你保持联系的人越是各式各样,效果就越好。尝试与不同研究组,AI实验
室,不同学术领域的人交换论文。使自己成为没有联系的两个科研组交流的桥梁,这
样,很快的,你的桌子上就会冒出一大摞相关的论文。
如果某篇论文引用了自己感兴趣的某些东西,做好笔记。维护一份自己感
兴趣参考文献的日志。到图书馆去看看能不能找到这些论文。如果要了解某个主题的
发展轨迹,可以有意地去做一张引用的“参考文献”图。所谓的参考文献图,是指引
用组成的网:论文A引用B和C,B引用C和D,C引用D,等等。注意那些被经常引用的论
文,这通常是值得阅读的。参考文献图有奇妙的性质。一个是经常有研究同一主题的
研究组相互不了解。你搜索该图,突然发现了进入另一部分的方式,这通常出现于不
同学校或者不同方法存在的地方。尽可能了解多种方法是很有价值的,这总比非常深
入的了解某一种方法更好。
暂时搁置。跟别人交谈。告诉他们你在做什么,并询问人家在做什么。(
如果你对与别的学生讨论自己的想法感到害羞,也要坚持交谈,即使自己没有什么想
法,与他们讨论自己认为确实优秀的论文。这将很自然地引导到下一步做什么的讨论
。)每天中午在活动楼七层有一个非正式的午餐讨论会。在我们实验室,人们都习惯
于晚上工作,所以午餐的时候可以跟别人组成松散的小组进行讨论。
如果你与外界的交流很多——做演示或者参加会议——去印张事务名片,
主要要使自己的名字容易记住。
从某个时间开始,你将会开始参加学术会议。如果你确实参加了,你会发
现一个事实,几乎所有的会议论文都令人生厌或者愚蠢透顶。(这其中的理由很有意
思,但与本文无关,不做讨论)。那还去参加会议干吗?主要是为了结识实验室之外
的人。外面的人会传播有关你的工作的新闻,邀请你作报告,告知你某地的学术风气
和研究者的特点,把你介绍给其他人,帮助你找到一份暑期工作,诸如此类。如何与
别人结识呢?如果觉得某人的论文有价值,跑上去,说:“我非常欣赏您的论文”,
并提问一个问题。
获得到别的实验室进行暑期工作的机会。这样你会结识另外一群人,或许
还会学到另外一种看待事物的方式。可以去问高年级同学如何获取这样的机会,他们
或许已经在你想去的地方工作过了,能帮你联系。
通常的情况,你只能做AI领域的事情,对AI领域之外的事情一无所知,好像有些
人现在也仍然这么认为。但是,现在要求好的研究者对几个相关的领域都了解颇深。
计算的可行性本身并没有对什么是智能提供足够的约束,其他的领域给出了其他形式
的约束,例如心理学获得的经验数据。更重要的是,其他的研究领域给了你思考的新
工具,看待智能的新方法。学习其他领域的另外一个原因是AI本身并没有评价研究价
值的标准,全是借自于其他领域。数学将定理作为进展;工程会问某个对象是否工作
可靠;心理学要求可重复的试验;哲学有严格的思辨;等等。所有这些标准有时都在
AI中起作用,熟悉这些标准有助于你评价他人的工作,深入自己的工作以及保护自己
的工作。
经过六年左右的课程方可获得MIT的PhD,你可以在一到两个非AI领域里打下坚实
的基础,在更多的领域内具有阅读水平,并且必须对大部分内容具有一定程度的理解
。下面是如何学习自己所知甚少领域的一些方法:
选修一门研究生课程,这很牢靠,但通常不是最有效的方法。
阅读课本。这方法还算不错,不过课本的知识经常是过时的,一般还有很
高比例的与内容无关的修辞。
找出该领域最棒的期刊是什么,向该领域的高人请教。然后找出最近几年
值得阅读的文章,并跟踪相关参考文献。这是最快的感受该领域的方法,但有时候你
也许会有错误的理解。
找出该领域最著名的学者,阅读他们所著的书籍。
跟该领域的研究生泡在一起。
参看外校研究该领域的系的课程表。拜访那里的研究院办公室,挑选有用的的文献。
计算机科学是我们所使用的技术。你需要选修的初级研究生课程肯定不能
让你对计算机科学有足够的了解,因此你必须通过阅读学习更多的知识。计算机科学
所有的领域——理论体系结构,系统,语言等等——都是必须学习的。
数学可能是接下来需要了解的最重要的学科。对于工作在视觉或者机器人
学的人来说更关键。对于以系统为中心的工作,表面上看,并不相关,但数学会教你
有用的思维方式。你需要能阅读定理,如果具有证明定理的能力将会给本领域的大多
数人留下深刻的印象。很少有人能自学数学,光做个听众是不够的,还得做习题集。
尽可能早地选修尽可能多的数学课,其他领域的课程以后选也很容易。
计算机科学是以离散数学为基础的:代数,图论,等等。如果你要从事推理方面
的工作,逻辑是很重要的。逻辑在MIT用得不多,但是在斯坦福以及其他地方,这是
认识思维的主流方法。所以你必须具备足够的逻辑知识,这样你才能保护自己的观点
。在MIT数学系选修一两门课程就足够了。要是研究兴趣在感知和机器人,那么不仅
需要离散数学,还需要连续数学。在分析,微分几何和拓扑学具有扎实的基础将会给
你提供最常使用的技巧。统计和概率只是一般有用。
认知心理学与AI共享几乎完全相同的观点,但是实践者确实具有不同的目
标,他们主要是做实验而不是写程序。每一个人都需要知道认知心理学的某些知识。
在MIT,Molly Potter开了一门很好的有关认知心理学的初级研究生课程。
如果你想做有关学习的工作,那么发展心理学是很重要的。发展心理学从
一般意义上讲也是很有用的,它能告诉你对于人类智能来说,哪些事情难哪些容易。
它还给出了有关认知体系结构的认知模型。例如,有关儿童语言习得的工作就对语言
处理理论施加了坚实的约束。在MIT,Susan Carey开了一门很好的有关发展心理学的
初级研究生课程。
心理学中更“软”的部分,例如心理分析和社会心理学,对AI的影响看似
很小,但具有潜在的重大意义。它们会给你非常不同的理解人是什么的方式。象社会
学和人类学这样的社会科学可以起相似的作用。具有多种观点是很有用的。上述学科
你需要自学。不幸的是,很难区分出这些领域哪些是优秀的成果哪些是垃圾。到哈佛
去学习:对于MIT的学生来说,很容易交叉注册哈佛的课程。
神经科学告诉我们有关人体可计算硬件的知识。随着最近可计算神经科学
和联结主义的兴起,对AI具有非常大的影响。MIT的脑和行为科学系提供了非常好的
课程,视觉(Hildreth, Poggio, Richards, Ullman),移动控制(Hollerbach, Bizzi
)和普通神经科学(9.015,由专家组讲授)。
如果你想研究自然语言处理,语言学是很重要的。不仅如此,它还包含了
很多有关人类认知的约束。在MIT,语言学主要由Chomsky学院负责。你可以去看看是
不是符合自己的兴趣。George Lakoff最近出版的书《Women, Fire, and Dangerous
Things》可作为另外一种研究程序的例子。
工程,特别是电机工程,已经被很多AI研究机构作为一个研究领域。我们
实验室在培养程序中加入了很多需要确实做一些东西的要求,例如分析电路。了解EE
也有助于建造定制的芯片或者调试自己的Lisp机器上的电源。
物理学对于那些对感知和机器人感兴趣的人具有强大的影响。
哲学是所有AI领域看不见的框架。很多AI工作都有蕴含着哲学的影响。学
习哲学也能帮助你运用或者读懂很多AI论文中用到的观点。哲学可沿着至少两个正交
的轴分解。哲学通常是某种东西的哲学;有关思维和语言的哲学与AI更相关。然后存
在着多种哲学学派,从比较大的范围来分,哲学可分为分析哲学和大陆哲学。分析哲
学有关思维的观点与AI领域大多数研究者一致。大陆哲学则对我们习以为常的很多东
西有非常不同的看待方式。它曾经被Dreyfus用于证明AI是不可能的。就在不久前,
有几位研究者认为大陆哲学与AI是相容的,提供了另外一种解决问题的方法。MIT的
哲学属于分析哲学,哲学学院深深地受到Chomsky在语言学方面工作的影响。
看起来要学习太多的东西,是不是?确实如此。要小心一个陷阱:认为对于所有
的X,“只有我对X了解的更多,这个问题才会变得容易”。要知道,与之相关需要进
一步了解的东西是永远没完的,但最终你还是要坐下来,解决问题的。
5. 笔记
很多科学家都有做科研笔记的习惯,你也应该这样。可能你曾被告知从五年级开
始,对于每一门科学课都应该记笔记,确实如此。不同的记笔记方式适用于不同的人
,可以做在线笔记,记在笔记本或者便笺簿上。可能需要在实验室有一个,家里还有
一个。
在笔记本上记录下自己的想法。只有你自己才会去读它,因此可以记得比较随意
。记录下自己的思索,当前工作中遇到的问题,可能的解决方案。对将来可能用到的
参考文献作小结。
定期翻阅你自己的笔记本。有些人会做月度总结,方便将来的引用。
笔记中记录中的东西经常可以作为一篇论文的骨干。这会使生活变得轻松些。相反,
你会发现写粗略的论文——标题,摘要,分标题,以及正文的片段——是一种记录自
己当前工作的有效方式,即使你并不准备把它变成一篇真正的论文。(过一段时间你
或许会改变想法)。
你或许会发现Vera Johnson-Steiner的书《Notebooks of the Mind》很有用,
该书并不是描写如何做笔记的文献,它描述了随着思想片断的积累,创新思想是如何
出现的。
6. 写作
写作的理由有很多。
在整个读研的过程中,你需要写一到两篇(这取决于你所在系的规定)毕
业论文,以获得PhD或者MS。
勤于写作不仅仅给你练习的机会。
学术的规则就是要么发表,要么腐烂。在很多领域和学校,这通常开始于
你成为一名教授时,但是我们实验室的很多研究生毕业之前就已经开始发表论文了。
鼓励发表和分发论文是很好的政策。
写下自己的想法是很好的调整思路的方式。你会经常地发现自以为很完美
的想法一旦写下来就显得语无伦次。
如果你工作的目的是不仅为自己还要为他人服务,就必须把它发表。这也
是研究的基本责任。如果你写得精彩,会有更多的人来了解你的工作。
AI但凭单打独斗是很难做的,你需要经常地从他人那里获得反馈。对你的
论文作评论就是最重要的一种形式。任何事情,要做就要做到最好。
阅读有关如何写作的书籍。Strunk和White的《Elements of Style》对基
本的应该如何不应该如何做了介绍。Claire的《The MLA's Line By Line》(Houghton
Mifflin)是有关在句子级别如何编辑的书籍。Jacques Barzun的《Simple and Direct
: A Rhetoric for Writers》(Harper and Row, 1985)是有关如何作文的。
写论文时,读读那些写作高超的书,并思考作者的句法运用。你会发现不
知不觉地,你已经吸收了作者的风格。
要成为写作高手,需要付出颇多,历经数年,期间还要忍受和认真对待他
人的批评。除此之外,并无捷径可走。
写作有时候是很痛苦的,看起来好像是从“实际的”工作中分心了。但如
果你已经掌握了写作技巧,写起来会很快。而且如果你把写作当作一门艺术的话,你
能从中得到很多乐趣。
你肯定会遇到思路阻塞的情况,这有很多的可能原因,没有一定可以避免
的方法。追求完美可能导致思路阻塞:无论开始写什么,总觉得不够好。要理解写作
是一个调试的过程。先写一个草稿,然后返回修订。写草稿有助于理顺思路,如果写
不出来正文,那就写个大纲。逐步对之细化,直到已经很容易写出子部分的内容。如
果连草稿也写不出来,隐藏掉正在写作的所有窗口,然后随便输入自己脑袋里想到的
东西,即使看起来好像是垃圾。当你已经写出了很多文本后,重新打开窗口,将刚才
写的东西编辑进去。
另外一个错误是以为可以将所有的内容依次写出。通常你应该将论文的核心内容
写出来,最后才是介绍部分。引起作者思路阻塞的另一个原因是不切实际的以为写作
是很容易的事情。写作是耗时耗力的,如果发现自己每天只能写一页,也不要放弃。
完美主义可能会导致对本来已经足够好的论文还在不停地打磨。这是浪费
时间。(这也是一种有意无意之间逃避做研究的表现)。将论文看作你与本领域其他
人交谈时的一句话。在交谈中,并不是每一句话都是完美的。很少有人会期待自己的
某次谈话就是全部的故事,是与对方的最后一次交流。
写信是一种很好的练习。很多技术论文,如果其风格更类似于给朋友的信
,那么会有很大的提高。坚持记日记也是练习写作的方法(也会使你试验更多的文体
,不仅仅是技术论文)。这两种方法还有其它的实质作用。
一个常见的陷阱是花很多时间去追求修辞而不是内容。要避免这样。LaTeX
并非完美,但是它有很多你所需的修饰语。如果这还不够,还可从其他从事这一研究
的人那里借用一些词语用法。很多站点(例如MIT)维护了一个写作修辞的库。
清楚自己要表达什么。这是清楚的写作中最难最重要的因素。如果你写了
拙劣的东西,且不知道如何修改,这很有可能是因为你不知道自己要说什么。一旦搞
清楚了自己要说什么,说就行了。
论文的写作要有利于读者查找到你所做的工作。无论是段落的组织还是通
篇的组织,都要将最核心的部分放在前面。要精心写作摘要。确保摘要已经反映出你
的好思路是什么。确保自己明白自己的创新点是什么,然后用几句话表达出来。太多
的论文摘要只是一般性地介绍论文,说是有一个好思路,却不说是什么。
不要用大话来贩卖你的工作。你的读者都是很优秀的人,正直且自尊。与
之相反,也不要为自己的工作道歉或者进行消减。
有时候你意识到某个子句、句子或者段落不够好,却不知道如何修改。这
是因为你钻到死胡同里出不来了。你需要返回重写这一部分。现实中这种情况很少发
生。
确保自己的论文中有中心思想。如果你的程序在10毫秒内解决了问题X,告
诉读者你是如何办到的。不要只是解释呢的系统是如何构建的,是做什么的,还要解
释其工作原理和价值所在。
写作是给人看的,而不是机器。因此光观点正确是不行的,还要易懂。不
要靠读者自己去推理,除非是最明显的推论。如果你在第七页的脚注上解释了某个小
玩意的工作原理,接着在第二十三页没有进一步解释就引用了它,此时如果读者感到
困惑一点都不值得奇怪。正式的论文要写清楚是很难的。不要模仿数学领域的文献,
它们的标准是尽可能少的解释,使读者感到越困难越好。这并不适用于AI。
写完一篇论文后,删掉第一段或者头几句话。你会发现那是与内容无关的
一般性话语,更好的介绍语句在第一段最后或者第二段的开头。
如果你等做完所有的工作后才开始写作,会失去很多。一旦开始了某个科研项目
,要养成这样的习惯:写作解释当前工作进展或者每几个月学习所得的非正式论文。
从你的研究笔记中的记载开始。花两天的时间写下来——如果你花的时间更长,说明
你是一个完美主义者。将论文与你的朋友分享。写的是草稿——不是为了被引用的那
种。将论文复制数十份,送给那些感兴趣的人(包括你的导师)。与写正式论文相比
,这样做具有很多相同的好处(评论,理清思路,写作练习等等),而且从某种意义
上讲,付出无需那么多。经常地,如果你做得不错,这些非正式论文以后可以作为正
式论文的骨干内容,也就是从AI实验室的Working Paper成为一篇期刊文章。
一旦你成为Secret Paper Passing Network的成员,会有很多人给你寄论文拷贝
要求评论。获得他人对自己的论文的评论是很有价值的。因此你评论的论文越多,你
获得支持就越多,也会收到更多人对你论文的评论。不仅如此,学习评价别人的论文
有助你的选择。
为论文写有用的评论是一门艺术。
要写出有用的评论,需要读两遍论文。第一遍了解其思想,第二遍开始作
评论。
如果某人在论文中屡次犯同一错误,不要每次都标记出来。而是要弄清楚
模式是什么,他为什么这样做,对此还可以做什么,然后在第一页清晰地指出或者私
下交流。
论文的作者在合并你的评论时,将会遵循最小修改的原则。如果可以,就
只修改一个词,不行再修改一个词组,再不行才修改整个句子。如果他的论文中某些
拙劣之处使得他必须修改整个段落,整个小节甚至整篇论文的组织,要用大字体的字
母指出来,这样他才不会忽视。
不要在论文写毁灭性的批评如“垃圾”。这对于作者毫无帮助。花时间提
出建设性的建议。要设身处地地为作者着想。
评论有很多种。有对表达的评论,有对内容的评论。对表达的评论也可以很不同
,可以是校对打字稿,标点,拼写错误,字词丢失等。应该学一些标准的编辑符号。
还可以是校正语法,修辞,以及混乱不清楚的段落。通常人们会持续地犯同一语法错
误,因此需要花时间明确地指出。接下来是对组织结构的评论:不同程度(子句,句
子,段落,小节乃至一章)的次序混乱,冗余,无关的内容,以及丢失论点。
很难描述对内容进行评论的特征。你可能建议作者扩展自己的想法,考虑某个问
题,错误,潜在的问题,表达赞美等。“因为Y,你应该读X”是一种总是有用的评论。
当被要求对论文作评论时,你首先想弄清楚哪种评论更有用。对于早期的论文草稿,
需要你主要对内容和论文的组织结构作评论;对于最终的草稿,需要你主要评论表达
的细节。注意,作为一种礼貌,在要求别人评论之前,应首先用拼写检查器对自己的
论文进行检查。
你无须接受所有的意见,但是必须都认真对待。将论文的部分内容裁掉是挺令人
痛心的,但往往也提高了论文的水平。你经常会发现某个意见确实指出了问题,但是
解决方法你觉得不可接受,那么就去寻找第三条道路。
要多发表论文,这其实比想象中的容易。基本上,AI出版物评审者评审论文的标
准是:(a)有新意;(b)在某些方面,符合标准。看看IJCAI的会议录,你会发现论文录
取的标准相当低。这种情况由于评审过程本身固有的随机性而变得更糟糕了。所以一
个发表论文的诀窍是不停地试。
确保论文可读性比较好。论文被拒绝的原因,除了没有意义之外,就是无
法理解或者组织糟糕。
论文在投往期刊之前,应该交流一段时间,并根据反馈的评论进行适当的
修订。要抵制那种急匆匆地把结果投往期刊的做法。在AI领域,没有竞赛,而且不管
怎么说,出版周期的延迟要大大超过对草稿进行评论的时间。
读一读你想投稿的期刊或者会议的过刊,确保自己论文的风格和内容是适合的。
很多出版物都有一页左右的“作者投稿须知”,仔细看看。
主要的会议都会在被接收的论文中评出内容和表达俱佳的获奖论文,仔细
研究研究。
通常是向会议投交一篇篇幅比较短的有关部分工作内容的早期报告,然后
再往期刊投交一份篇幅长的最终的正式论文。
论文被决绝了——千万不要沮丧灰心。
期刊和会议的论文评审过程存在很大的不同。为了节省时间,会议论文的
评审必须迅速,没有时间细究或者交流。如果你被拒绝了,你就失败了。但期
刊论文则不同,你可以经常地与编辑争辩,通过编辑与评审人争辩。
评审人一般都会对你有帮助的。如果你收到了令人生厌的评审报告,应该
向大会的程序主席或者编辑投诉。不能期望可以从会议论文评审人的报告那里
得到多少反馈。但对于期刊论文,往往可以得到非常棒的建议。你不必完全按
照评审报告的建议去做,但是,如果你不按照报告去做,那么就必须解释原因
,并且要意识到这可能会导致进一步的负面评价。不管怎么样,无论是哪种的
评审,作为评审者都要有礼貌。因为在余下的职业生涯中,你将会与被评审者
在一个学术圈子里。
MIT AI Lab Memos大体上是或者接近发表的水平。实际上,Technical
Reports基本上都是这些Memos的修订版本。Working Papers则更不正式,这是
很好的将自己的论文分发给同事们的方法。要出版这些内部文件,只需到
Publications Office(在活动楼八层)领一份表格,并有两位教员签字即可。
就像其它的科研活动一样,论文写作所花的时间总是比期望的要高。论文
的发表在耗费时间这个问题上则更严重。当你完成了一篇论文,投出去,等待
发表。数月后,论文以及评论被返回来。你不得不对论文进行修改。然后又是
几个月,才返回对你的修改的确认。如果你同时发表了该论文的不同形式,如
有一篇短的投会议,一篇长的投期刊,这样的过程将反复数个回合。结果有可
能是当你已经厌倦了,研究主题也已经令人生厌后数年,你仍然在修改那篇论
文。这启示我们:不要去做那些需要热情投入但是很难发表论文的研究——苦
不堪言。