- 装帧:平装
- 作者:高广尚
- ISBN:9787030603586
- 出版日期:2019-8-1
- 书名:基于代表记录的增量实体解析方法研究
- 出版社:科学出版社
- 开本:26 × 19
论文提出通过产生更能代表记录簇的代表记录并基于代表记录集,来让与演化的记录紧密相关的记录簇进行自适应调整,以实现增量实体解析这一新思路,同时明确论文要研究的三个关键问题:(1)如何在解析数据集时产生更能代表记录簇的代表记录以有利于其中潜在相似记录的合并或排除?(2)如何找出解析过程中遗漏的潜在相似记录并将它们划分到同一个记录簇,从而让代表记录的代表性进一步得到增强?(3)如何在数据集不断演化时基于代表记录集来让相关的记录簇进行快速有效地自适应调整?论文采用Cora数据集分别对提出模型的有效性、可行性进行验证,并从整体上将文中方法与相关性聚类方法进行了对比,并进一步将它们的结果和Cora数据集中人工划分的结果进行了对比。实验结果表明文中方法相较于较相关性聚类方法在解析效率、解析精度等方面都有一定程度的优势。