NSL OpenIR  > 中国科学院文献情报中心(北京)  > 信息系统部
基于多重文本关系图中clique子团聚类的主题识别方法研究
郭红梅1; 孔贝贝1; 张智雄1,2
2017
Source Publication情报学报
Volume36Issue:5Pages:433-442
Abstract

在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。

KeywordClique子团 多重文本关系 文本主题识别
URL查看原文
Indexed ByCSCD ; CSSCI ; 中文核心期刊要目总览
Language中文
CSCD IDCSCD:6009617
Citation statistics
Cited Times:2[CSCD]   [CSCD Record]
Document Type期刊论文
Identifierhttp://ir.las.ac.cn/handle/12502/10540
Collection中国科学院文献情报中心(北京)_信息系统部
Affiliation1.中国科学院文献情报中心
2.中国科学院大学
First Author Affilication中国科学院文献情报中心
Recommended Citation
GB/T 7714
郭红梅,孔贝贝,张智雄. 基于多重文本关系图中clique子团聚类的主题识别方法研究[J]. 情报学报,2017,36(5):433-442.
APA 郭红梅,孔贝贝,&张智雄.(2017).基于多重文本关系图中clique子团聚类的主题识别方法研究.情报学报,36(5),433-442.
MLA 郭红梅,et al."基于多重文本关系图中clique子团聚类的主题识别方法研究".情报学报 36.5(2017):433-442.
Files in This Item: Download All
File Name/Size DocType Version Access License
基于多重文本关系图中clique子团聚类(1847KB)期刊论文作者接受稿开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[郭红梅]'s Articles
[孔贝贝]'s Articles
[张智雄]'s Articles
Baidu academic
Similar articles in Baidu academic
[郭红梅]'s Articles
[孔贝贝]'s Articles
[张智雄]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[郭红梅]'s Articles
[孔贝贝]'s Articles
[张智雄]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 基于多重文本关系图中clique子团聚类的主题识别方法研究_郭红梅.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.