基于科研人员本体的知识产出自动获取方法与技术研究结题报告 | |
卢利农![]() | |
2013-12 | |
Keyword | 自动获取 人名消歧 科研人员本体 语义网 |
Subject Area | 信息组织与服务 ; 信息技术 |
Abstract | 本项目通过构建科研人员本体,对机器采集获取到的知识产出与其作者主体之间建立可靠的对应关系,增强学术产出自动获取过程中的机器理解能力,降低人名二义性,实现名称消歧,可靠聚集作者的学术产出。 首先对科研领域的各种人物实体进行抽象分析,选取与人物属性相关的重要概念,设计形成了科研人员本体的概念集和属性集。通过对科研人员、知识产出、所属机构三者实体关系进行语义层次上的描述和关联表示,结合对vivo、foaf、prism等本体的学习复用,最终研究构建了科研人员本体。 项目通过WOS等知识资源库中的Web Service接口实现批量采集元数据,设计创造了“首条存储语义实例——循环语义匹配——差异实例化——相似度赋值”技术路径,对采集到的所有元数据进行了作者语义匹配和相似度赋值,并结合Jena等技术实现作者批量实例化。 最后,对整体方案进行了检验。实验结果表明,本项目的方法较好的实现了对同名作者的唯一辨识,相比传统的人工匹配,大大减轻了系统管理人员的负担,且具有较高的准确率与召回率。对同名作者的匹配,既支持将匹配度较高的作者自动合并,同时对匹配度较低作者间相似值进行保存,为管理人员人工识别提供接口。 |
Funding Project | 中国科学院国家科学图书馆青年人才前沿领域基金项目“基于科研人员本体的学术产出自动获取方法与技术研究”(项目编号:Y200091001)的研究成果之一 |
Document Type | 研究报告 |
Identifier | http://ir.las.ac.cn/handle/12502/6539 |
Collection | 中国科学院兰州文献情报中心_资源系统建设部 |
Recommended Citation GB/T 7714 | 卢利农. 基于科研人员本体的知识产出自动获取方法与技术研究结题报告. 2013. |
Files in This Item: | Download All | |||||
File Name/Size | DocType | Version | Access | License | ||
基于人名知识本体的学术产出自动获取方法与(1327KB) | 开放获取 | View Download |
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment