基于学术产出挖掘的用户兴趣建模研究
姚晓娜
2013
关键词用户兴趣建模 文本挖掘 本体 实体关系对
英文摘要

个性化服务实现的核心在于用户建模——建立用户兴趣、目标和行为的数据结构。用户模型所包含信息的丰富程度,决定个性化服务的可靠准确程度和水平。数字图书馆的用户大多为科研人员,他们的学术产出也是当前数字图书馆的重要资源。学术产出不仅包含了科研人员的领域背景和研究方向,也隐含了关于科研人员研究兴趣的信息。

本研究选择地学领域为目标领域,以Web of Science文献数据库为学术产出的数据来源,从中采集了若干科研人员的学术产出数据,并对其中蕴含的兴趣信息进行梳理和分析。然后在复用用户本体FOAF、兴趣本体WI、地学本体SWEET等已有本体的基础上,设计了基于本体的用户兴趣模型,建立了学术产出到用户兴趣模型的映射关系。其中作者、机构、期刊等元数据,直接作为兴趣项,对于标题、摘要等非结构化的数据,采用了开源文本挖掘工具GATE进行实体识别和关系抽取,并将得到的实体关系对作为兴趣项。在分析兴趣度的各种影响因素的基础上,对各兴趣项的兴趣度进行计算。最后将生成的用户兴趣实例存储到Sesame本体数据库中,支持通过SeRQL和SPARQL语言进行查询。

本研究以科研用户公开发表的学术产出为数据源,首先避免了用户兴趣建模初期存在的冷启动问题;然后采用本体技术进行用户兴趣建模,并提出一种通过实体关系对表示用户兴趣的方法,与使用单个关键词或实体的表示方法相比,语义信息更为丰富,能更好的描述用户兴趣;最后实现了用户兴趣信息的语义化存储和检索,为以后实现基于本体的个性化服务打下基础。

所属项目名称中国科学院国家科学图书馆青年人才前沿领域基金项目“基于学术产出挖掘的用户兴趣建模研究”(项目编号:Y200081001)
文献类型研究报告
条目标识符http://ir.las.ac.cn/handle/12502/6540
专题中国科学院兰州文献情报中心_资源系统建设部
推荐引用方式
GB/T 7714
姚晓娜. 基于学术产出挖掘的用户兴趣建模研究. 2013.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于学术产出挖掘的用户兴趣建模.pdf(1163KB) 开放获取请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[姚晓娜]的文章
百度学术
百度学术中相似的文章
[姚晓娜]的文章
必应学术
必应学术中相似的文章
[姚晓娜]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。