根据基于领域本体的向心权值扩散策略,可以对异构用户个性化本体的相似度进行计算
我们抽取了第一作者为南京地区的共计5438篇图情方面的文献,其中有作者2392人,其中发文数量大于10篇的有55人。对于这些作者而言,他们拥有足够多的文献数据,所以我们可以利用每位作者所发文献的关键词来表示他们各自的研究兴趣。
每个作者的初始用户个性化模式构造方法说明如下:首先抽取每个作者的每篇所发文献,抽取每篇文献中的所有关键词;其次,将这些每篇文献中的关键词分成一组,按照文档排列升序排列,并自动构建出所有低频关键词指向高频关键词的共现对链接;最终,对相同的关键词共现对链接累计,以出现次数作为权值,可以对每个作者,得到以一组相关联系的关键词共现对链接来表示的原始个性化模式。如抽取的南京大学苏新宁教授所发文献共计11篇,如表所示:
文献名称 |
期刊 |
年份 |
关键词 |
《中文社会科学引文索引》在科研及管理中的作用 |
图书情报工作 |
2003 |
中文社会科学引文索引;科学研究;科研管理; |
企业知识管理研究与实践的进展 |
图书情报知识 |
2003 |
知识管理;企业管理; |
引文索引数据质量控制研究 |
中国图书馆学报 |
2001 |
引文索引;数据质量控制;规范文档; |
网络环境下竞争情报系统设计 |
情报理论与实践 |
2010 |
竞争情报;竞争情报系统;系统设计;网络; |
网格环境下的个性化信息推荐服务模型研究 |
情报学报 |
2007 |
网格环境;个性化服务;信息推荐;网格中间件; |
图书馆、情报与文献学研究热点与趋势分析(2000~2004)——基于CSSCI的分析 |
情报学报 |
2007 |
图书馆学;情报学;档案学;研究热点;研究趋势;CSSCI; |
图书馆、情报与文献学学术影响力研究报告(2000-2004)--基于CSSCI的分析 |
情报学报 |
2006 |
图书馆学;情报学;档案学;分析评价;CSSCI; |
视频信息索引技术研究进展 |
情报学报 |
2004 |
视频索引;MPEG标准;视频信息自动处理; |
中国社会科学引文索引设计 |
情报学报 |
2000 |
CSSCI;引文索引;系统设计; |
超文本技术在全文检索系统中的实现 |
情报学报 |
2000 |
全文检索;超文本检索;动态超文本; |
人文社会科学期刊评价指标体系研究 |
图书馆论坛 |
2006 |
期刊评价;评价指标;指标体系;人文社会科学; |
从中自动构建的作者个性化模式如图所示
按照该方法,可以对所有的作者做相同的处理。可以看出,不同作者所对应的不同个性化模式在结构和权值上都具有较大的差异。利用前文所述的权值扩散方法和相似度比较方法,我们对这55位作者进行了两两比较,以分析作者之间的兴趣相似度,部分兴趣相似度较高的作者及其关系如图所示
其中,节点颜色越深,表示兴趣相近的作者数量越多,而链接颜色越深,则表示两者兴趣越相近。