中国科学院文献情报中心机构知识库
Advanced  
NSL OpenIR  > 中国科学院兰州文献情报中心  > 信息系统部  > 研究报告
Title: 基于学术产出挖掘的用户兴趣建模研究
Author: 姚晓娜
Issued Date: 2013
Keyword: 用户兴趣建模 ; 文本挖掘 ; 本体 ; 实体关系对
Abstract:

个性化服务实现的核心在于用户建模——建立用户兴趣、目标和行为的数据结构。用户模型所包含信息的丰富程度,决定个性化服务的可靠准确程度和水平。数字图书馆的用户大多为科研人员,他们的学术产出也是当前数字图书馆的重要资源。学术产出不仅包含了科研人员的领域背景和研究方向,也隐含了关于科研人员研究兴趣的信息。

本研究选择地学领域为目标领域,以Web of Science文献数据库为学术产出的数据来源,从中采集了若干科研人员的学术产出数据,并对其中蕴含的兴趣信息进行梳理和分析。然后在复用用户本体FOAF、兴趣本体WI、地学本体SWEET等已有本体的基础上,设计了基于本体的用户兴趣模型,建立了学术产出到用户兴趣模型的映射关系。其中作者、机构、期刊等元数据,直接作为兴趣项,对于标题、摘要等非结构化的数据,采用了开源文本挖掘工具GATE进行实体识别和关系抽取,并将得到的实体关系对作为兴趣项。在分析兴趣度的各种影响因素的基础上,对各兴趣项的兴趣度进行计算。最后将生成的用户兴趣实例存储到Sesame本体数据库中,支持通过SeRQL和SPARQL语言进行查询。

本研究以科研用户公开发表的学术产出为数据源,首先避免了用户兴趣建模初期存在的冷启动问题;然后采用本体技术进行用户兴趣建模,并提出一种通过实体关系对表示用户兴趣的方法,与使用单个关键词或实体的表示方法相比,语义信息更为丰富,能更好的描述用户兴趣;最后实现了用户兴趣信息的语义化存储和检索,为以后实现基于本体的个性化服务打下基础。

Project: 中国科学院国家科学图书馆青年人才前沿领域基金项目“基于学术产出挖掘的用户兴趣建模研究”(项目编号:Y200081001)
Content Type: 研究报告
URI: http://ir.las.ac.cn/handle/12502/6540
Appears in Collections:中国科学院兰州文献情报中心_信息系统部_研究报告

Files in This Item: Download All
File Name/ File Size Content Type Version Access License
基于学术产出挖掘的用户兴趣建模.pdf(1163KB)----开放获取
View Download

Recommended Citation:
姚晓娜. 基于学术产出挖掘的用户兴趣建模研究. 2013.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[姚晓娜]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[姚晓娜]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
文件名: 基于学术产出挖掘的用户兴趣建模.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院文献情报中心 - Feedback
Powered by CSpace