科研实体名称规范的研究与实践 | |
张建勇1,2![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() | |
2019 | |
Source Publication | 数据分析与知识发现
![]() |
Volume | 3Issue:01Pages:27-37 |
Abstract | 【目的】建立机构规范、作者规范、期刊规范、基金规范, 为发现系统、科研实体分析评价等建立数据基 础。 【方法】以多源异构数据为基础, 对数据进行汇聚和融合, 形成具有唯一标识符的统一的结构化数据。依据 名称规范元数据模型, 对科研实体及实体间的关系进行抽取。针对不同的科研实体可获取的文献特征, 制定不同 的消歧规则集合, 结合传统字符串匹配方法和深度学习方法进行文本相似度计算。【结果】形成包含 260 多万条 数据的机构规范库、2 300 多万条数据的作者规范库、3万多条数据的期刊规范库和 200 多万条数据的基金规范 库。以 NSTL机构规范为例, 与 InCites 机构规范进行对比, 结果显示所遴选的美、英、中 3个国家的 6所高校, 对 标吻合度平均值达到 86.8%。【局限】所提出的消歧规则和算法在处理文献特征表达形式多样性方面有待进一步 细化和提升;需对具体数据源数据情况进行分析,以选择合适的算法模型。【结论】本研究提出了多源异构数据 汇聚融合方法, 设计了科研实体消歧规则和算法, 能够有效实现名称规范数据库建设的规范性和全面性。 |
Keyword | 名称规范 期刊规范 机构规范 基金规范 作者规范 |
Indexed By | 中文核心期刊要目总览 |
Language | 中文 |
Document Type | 期刊论文 |
Identifier | http://ir.las.ac.cn/handle/12502/10536 |
Collection | 中国科学院文献情报中心(北京)_信息系统部 |
Affiliation | 1.中国科学院文献情报中心 2.中国科学院大学图书情报与档案管理系 3.中国农业科学院农业信息研究所 4.上海科技大学图书馆 5.国家互联网应急中心 6.中国科学院自动化研究所 |
First Author Affilication | 中国科学院文献情报中心 |
Recommended Citation GB/T 7714 | 张建勇,钱力,于倩倩,等. 科研实体名称规范的研究与实践[J]. 数据分析与知识发现,2019,3(01):27-37. |
APA | 张建勇.,钱力.,于倩倩.,董智鹏.,黄永文.,...&王峰.(2019).科研实体名称规范的研究与实践.数据分析与知识发现,3(01),27-37. |
MLA | 张建勇,et al."科研实体名称规范的研究与实践".数据分析与知识发现 3.01(2019):27-37. |
Files in This Item: | Download All | |||||
File Name/Size | DocType | Version | Access | License | ||
科研实体名称规范的研究与实践_张建勇.p(1256KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | View Download |
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment