NSL OpenIR  > 中国科学院兰州文献情报中心  > 资源系统建设部
基于模式和投影学习的领域概念上下位关系自动识别研究
王思丽1,2; 祝忠明1,2; 杨恒1; 刘巍1
2020-08-05
Source Publication数据分析与知识发现
ISSN2096-3467
Volume4Issue:11Pages:15-25
Contribution Rank1
Abstract

[目的]实现对领域概念上下位关系的自动识别,以解决领域本体自动化构建中领域概念间语义关系的自动获取和确立问题。[方法]将传统无监督的基于模式的方法和当前先进的有监督的基于投影学习的方法有机结合起来应用于领域概念上下位关系自动识别,并进行了试验研究。[结果]能识别出领域概念的上位词集合,在医学领域的识别精度为0.88,通用领域的识别精度为0.83,在评估基准集BLESS上的平均精度为0.85。[局限]受句法歧义、语料集的质量等影响,模型精度尚未达到峰值,存在错误识别的情况。[结论]可发现同一概念词的不同意义的上位词,对低频词和命名实体也具有较好识别效果。未来可考虑从对高频顶层上位词进行适当减权、提升有监督语料集的质量等方面进行优化。 

KeywordHearst模式 投影学习 词嵌入 领域概念 上下位关系
DOI10.11925/infotech.2020.0299
URL查看原文
Indexed ByCSCD ; CSSCI ; 中文核心期刊要目总览
Language中文
CSCD IDCSCD:6853463
Citation statistics
Document Type期刊论文
Identifierhttp://ir.las.ac.cn/handle/12502/11263
Collection中国科学院兰州文献情报中心_资源系统建设部
Affiliation1.中国科学院西北生态环境资源研究院文献情报中心
2.中国科学院大学
First Author Affilication中国科学院文献情报中心
Recommended Citation
GB/T 7714
王思丽,祝忠明,杨恒,等. 基于模式和投影学习的领域概念上下位关系自动识别研究[J]. 数据分析与知识发现,2020,4(11):15-25.
APA 王思丽,祝忠明,杨恒,&刘巍.(2020).基于模式和投影学习的领域概念上下位关系自动识别研究.数据分析与知识发现,4(11),15-25.
MLA 王思丽,et al."基于模式和投影学习的领域概念上下位关系自动识别研究".数据分析与知识发现 4.11(2020):15-25.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[王思丽]'s Articles
[祝忠明]'s Articles
[杨恒]'s Articles
Baidu academic
Similar articles in Baidu academic
[王思丽]'s Articles
[祝忠明]'s Articles
[杨恒]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[王思丽]'s Articles
[祝忠明]'s Articles
[杨恒]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.