八卦胜地——论文致谢辞

February 8, 2009 11:51 am GMT-0700 | In Study | 14 Comments | hide

很早就和人提起过,毕业论文的致谢辞(thesis acknowledgment)简直是一个八卦胜地。有在里面大肆调侃合作者的,有在里面写感谢当年女朋友结果毕业没多久就分手的(这个其实不少见而且没什么问题,但是有些人提到这个会尴尬),有在里面没提老婆事后我才得知其实写论文的时候就已经在闹离婚的,也有在致谢辞里面求婚的,总之千奇百怪无奇不有。我的老板也提到,浏览以前学生的致谢辞,就仿佛能看见眼前晃过十几年的时光。

这里做的一个小工作是通过论文致谢辞来制作感谢网图。大家知道,很多大规模的实验室,里面的合作关系往往错综复杂,这一点可以通过论文致谢辞来分析和量化。定义感谢度:

AB 的感谢度 = 100 * A 在博士论文致谢辞里提到 B 的词数 / A 的致谢辞总词数。

这里的一个假设是,每个博士所得到的帮助总量是差不多的,但是有些人写致谢辞比较唐僧,所以需要 normalize 一下。被感谢度则定义为:

B 的被感谢度 = 所有博士生对 B 的感谢度总和。

我自动统计了我老板和我老板的老板在本领域带过的 22 个博士生的致谢辞,以下是画出来的感谢网一角(点进去可看完整的图)。每个节点代表一个人,节点大小由被感谢度决定;节点中间所标年份为博士毕业年份(2009 那个就是我啦),红背景的小数字为被感谢度。最大那个 237 就是我老板啦,次大那个 155 就是我老板当年的老板(他的被感谢度应该比 155 大很多,不过他 1997 年之后就基本不搞这个领域了,所以我没有统计进去)。节点之间连线表示感谢,粗细由感谢度决定(连线上的小数字所注)。TouchGraph 还自动进行了 cluster 计算,以不同颜色标注了小圈子。这里面有很多可以分析东西:比如那个 1997 年毕业的家伙身处中央,和各个集团都联系紧密,事实上我们都知道他确实是交际花;还有比如可以看出各个实验项目更新换代的线索。更多的也只有身在其中才能体会到,所以我就不多写了。

touchgraphyearrecent

P.S. 这个问题事实上一般化了以后是一个 citation network 的问题。有关 large network 的研究最近十几年很热门,比如可以看 Jure Leskovec 的博士论文答辩 Dynamics of large networks

Tags: , ,

This weblog is licensed under a Creative Commons License.
Powered by WordPress. Theme based on Pool by Borja Fernandez.