NSL OpenIR  > 中国科学院文献情报中心(北京)  > 信息系统部
科研实体名称规范的研究与实践
张建勇1,2; 钱力1,2; 于倩倩1; 董智鹏1; 黄永文3; 刘建华4; 郭舒5; 王峰6
2019
Source Publication数据分析与知识发现
Volume3Issue:01Pages:27-37
Abstract

【目的】建立机构规范、作者规范、期刊规范、基金规范, 为发现系统、科研实体分析评价等建立数据基 础。 【方法】以多源异构数据为基础, 对数据进行汇聚和融合, 形成具有唯一标识符的统一的结构化数据。依据 名称规范元数据模型, 对科研实体及实体间的关系进行抽取。针对不同的科研实体可获取的文献特征, 制定不同 的消歧规则集合, 结合传统字符串匹配方法和深度学习方法进行文本相似度计算。【结果】形成包含 260 多万条 数据的机构规范库、2 300 多万条数据的作者规范库、3万多条数据的期刊规范库和 200 多万条数据的基金规范 库。以 NSTL机构规范为例, 与 InCites 机构规范进行对比, 结果显示所遴选的美、英、中 3个国家的 6所高校, 对 标吻合度平均值达到 86.8%。【局限】所提出的消歧规则和算法在处理文献特征表达形式多样性方面有待进一步 细化和提升;需对具体数据源数据情况进行分析,以选择合适的算法模型。【结论】本研究提出了多源异构数据 汇聚融合方法, 设计了科研实体消歧规则和算法, 能够有效实现名称规范数据库建设的规范性和全面性。

Keyword名称规范 期刊规范 机构规范 基金规范 作者规范
Indexed By中文核心期刊要目总览
Language中文
Document Type期刊论文
Identifierhttp://ir.las.ac.cn/handle/12502/10536
Collection中国科学院文献情报中心(北京)_信息系统部
Affiliation1.中国科学院文献情报中心
2.中国科学院大学图书情报与档案管理系
3.中国农业科学院农业信息研究所
4.上海科技大学图书馆
5.国家互联网应急中心
6.中国科学院自动化研究所
First Author Affilication中国科学院文献情报中心
Recommended Citation
GB/T 7714
张建勇,钱力,于倩倩,等. 科研实体名称规范的研究与实践[J]. 数据分析与知识发现,2019,3(01):27-37.
APA 张建勇.,钱力.,于倩倩.,董智鹏.,黄永文.,...&王峰.(2019).科研实体名称规范的研究与实践.数据分析与知识发现,3(01),27-37.
MLA 张建勇,et al."科研实体名称规范的研究与实践".数据分析与知识发现 3.01(2019):27-37.
Files in This Item: Download All
File Name/Size DocType Version Access License
科研实体名称规范的研究与实践_张建勇.p(1256KB)期刊论文出版稿开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[张建勇]'s Articles
[钱力]'s Articles
[于倩倩]'s Articles
Baidu academic
Similar articles in Baidu academic
[张建勇]'s Articles
[钱力]'s Articles
[于倩倩]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[张建勇]'s Articles
[钱力]'s Articles
[于倩倩]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 科研实体名称规范的研究与实践_张建勇.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.