以文本方式查看主题 - 课外天地 李树青 (http://njcie.com/bbs/index.asp) -- 信息检索原理课件 (http://njcie.com/bbs/list.asp?boardid=16) ---- 南京地区图情方向学者的兴趣相似度 (http://njcie.com/bbs/dispbbs.asp?boardid=16&id=1141) |
||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:admin -- 发布时间:2012/2/18 21:49:38 -- [转帖]国产手机发展史:锤子手机 根据基于领域本体的向心权值扩散策略,可以对异构用户个性化本体的相似度进行计算
我们抽取了第一作者为南京地区的共计5438篇图情方面的文献,其中有作者2392人,其中发文数量大于10篇的有55人。对于这些作者而言,他们拥有足够多的文献数据,所以我们可以利用每位作者所发文献的关键词来表示他们各自的研究兴趣。
每个作者的初始用户个性化模式构造方法说明如下:首先抽取每个作者的每篇所发文献,抽取每篇文献中的所有关键词;其次,将这些每篇文献中的关键词分成一组,按照文档排列升序排列,并自动构建出所有低频关键词指向高频关键词的共现对链接;最终,对相同的关键词共现对链接累计,以出现次数作为权值,可以对每个作者,得到以一组相关联系的关键词共现对链接来表示的原始个性化模式。如抽取的南京大学苏新宁教授所发文献共计11篇,如表所示:
从中自动构建的作者个性化模式如图所示
按照该方法,可以对所有的作者做相同的处理。可以看出,不同作者所对应的不同个性化模式在结构和权值上都具有较大的差异。利用前文所述的权值扩散方法和相似度比较方法,我们对这55位作者进行了两两比较,以分析作者之间的兴趣相似度,部分兴趣相似度较高的作者及其关系如图所示
其中,节点颜色越深,表示兴趣相近的作者数量越多,而链接颜色越深,则表示两者兴趣越相近。 |