自学参考:
沐神论文精读系列
如何读论文
通常,一篇论文的结构为:
- title标题
- abstract摘要
- introduction介绍
- method方法
- experiments实验
- conclusion结论
一篇论文可以考虑读1~3遍
- 第一遍
海选:标题、摘要、结论,选读方法、实验中重要的图和表- 判断是否值得读下一轮:质量可以&适合自己的研究方向
- 第二遍
精选:快速地过一遍论文,不需要知道所有细节,弄清楚重要的图和表,每一部分在干什么。考虑解决了什么样的问题,和旁人的工作有何不同。
读不懂的话可先读引用文章,再回来继续读。- 判断是否继续读下一轮:若发现和自己的方向不一样,不需要深度了解,就此止步即可,否则继续完全搞懂这篇论文。
- 第三遍
精读:弄清楚每一句话在干什么,我会如何展开,还有什么可以继续往前走的地方。
如何找idea
方法1:打补丁法
- 首先,尽量找比较新的文章,空间比较大。
否则在已经是打补丁的文章中,作者可能已经试过很多补丁不可行了,你再去试可能会重复试到作者已经试过不work的方法 - 看文章有一些想法,再用实验看效果。效果也许不好,但也可能因此有一些新的想法
- 最后,用一个故事把自己的补丁穿起来。有时,为了故事的连贯性,可以把一些不是很重要的补丁拿走也是可以的。
如何判断研究工作的价值
另一个角度,写论文时如何讲自己的故事能使读者更容易看到我的研究工作的意义。
- 核心:用有新意的方法有效地解决一个研究问题
- 新意:指的是对所在领域的研究者有新意,也就是说,在做相同方向的研究者并没有想到过用相同的方法。并不要求方法一定是前人没有提到过,很有可能是很多年前别人已经用过了,但是随着时间的流逝,大家已经不记得了;或者是所用到的方法在别的领域有人用,但是在自己所在的研究领域并没有太多了解。
- 有效:对于某一个研究问题来讲,相对于之前的工作,当前工作解决问题的有效性有所提升
- 研究:有两大类问题
比如说算法比较占内存,跑不动,首先想到的是能不能买一些内存,如果买的内存够用的话那就没问题了;然后再看看代码能否进行优化,能否换一个实现的方式,使得在不改变算法的同时节省内存。
再比如模型的精度不够,首先看能否利用增加数据的方法来解决问题,或者在采样的时候,有更好的传感器进行采样。- 研究问题
对研究问题来说,一定是比较困难的问题,根本就不知道如何解决,或者说有一些想法,但是在实施这些想法之前比不知道是否可行,而且对于一般的研究问题,前面的一些想法通常来说是不行的 - 工程问题(绝大部分问题都是工程问题)
如果对一个问题,能够提出几种方案,而且这些方案在没有尝试的情况下就能知道是能够解决问题的,那么很有可能这个问题就是一个工程问题
- 研究问题
摘要就可以按照以下逻辑展开:为解决某一个研究问题,我的方法新意是哪些,取得了如何的效果。
- 量化:价值 = 新意度 * 有效性 * 问题大小
- 新意度
- 1:大家并不感到意外,比如说用的方法大家都知道,而且知道使用之后的结果大概是什么样子
- 10:有一定新意度,比如在某个方面用某一个技术解决了还不错的问题
- 100:表示所用的技术之前大家并不熟悉,使用之后打开了新世界的大门
- 新意也不是绝对的,对于技术类的工作来说,很难有一个技术之前从来没有出现过
- 有效性
- 1:比如说关心的是一个模型的精度,可能比前面的模型精度高了一点点
- 10:比如说领域内的工作一年之内能把一个数据集的精度提升10个点,能提升一个点也是相当不错了
- 100:比如说一个工作就能将数据集的精度提升5个点,甚至是10个点
- 当然取决于问题的不同,对有效性的定义也是不一样的,但是对于一个技术问题来说,通常就关心三个问题:
- 1、效果:比如说精度;
- 2、规模:比如说成本的降低;
- 3、安全
- 问题大小
- 1:对前面的工作的某一个点上的不足加以改进
- 10:比如机器视觉中某一视觉的子任务
- 100:比如说提升机器对图片的理解或者机器对文字的理解
- 当然还可以更大,比如说解决通用的人工智能,就可以达到1000甚至更大
- 新意度
在以上三个方向上都拿满分很难,有时候在两个方向上拿满分都是一件非常困难的事情,所以就需要考虑能不能在一个指标上拿满分;如果无法在任何一个指标上拿满分,就需要考虑是否能做到三个指标都能够均衡地达到10,这也是很不错的;如果能够在某两个指标上达到10,还是值得一写的,如果写的比较好的话,也是一个比较好的工作,否则的话,建议想一想在其他方向上是不是还有突破,至少在另外一个指标上拿到10
文章评论