基于科研人员本体的知识产出自动获取方法与技术研究结题报告
卢利农
2013-12
关键词自动获取 人名消歧 科研人员本体 语义网
学科分类信息组织与服务 ; 信息技术
英文摘要本项目通过构建科研人员本体,对机器采集获取到的知识产出与其作者主体之间建立可靠的对应关系,增强学术产出自动获取过程中的机器理解能力,降低人名二义性,实现名称消歧,可靠聚集作者的学术产出。
首先对科研领域的各种人物实体进行抽象分析,选取与人物属性相关的重要概念,设计形成了科研人员本体的概念集和属性集。通过对科研人员、知识产出、所属机构三者实体关系进行语义层次上的描述和关联表示,结合对vivo、foaf、prism等本体的学习复用,最终研究构建了科研人员本体。
项目通过WOS等知识资源库中的Web Service接口实现批量采集元数据,设计创造了“首条存储语义实例——循环语义匹配——差异实例化——相似度赋值”技术路径,对采集到的所有元数据进行了作者语义匹配和相似度赋值,并结合Jena等技术实现作者批量实例化。
最后,对整体方案进行了检验。实验结果表明,本项目的方法较好的实现了对同名作者的唯一辨识,相比传统的人工匹配,大大减轻了系统管理人员的负担,且具有较高的准确率与召回率。对同名作者的匹配,既支持将匹配度较高的作者自动合并,同时对匹配度较低作者间相似值进行保存,为管理人员人工识别提供接口。
所属项目名称中国科学院国家科学图书馆青年人才前沿领域基金项目“基于科研人员本体的学术产出自动获取方法与技术研究”(项目编号:Y200091001)的研究成果之一
文献类型研究报告
条目标识符http://ir.las.ac.cn/handle/12502/6539
专题中国科学院兰州文献情报中心_资源系统建设部
推荐引用方式
GB/T 7714
卢利农. 基于科研人员本体的知识产出自动获取方法与技术研究结题报告. 2013.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于人名知识本体的学术产出自动获取方法与(1327KB) 开放获取请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[卢利农]的文章
百度学术
百度学术中相似的文章
[卢利农]的文章
必应学术
必应学术中相似的文章
[卢利农]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。