论文浅尝 | 利用常识知识图增强零样本和少样本立场检测

news/2023/6/7 0:22:50

819ee3e0c7da6d0c247032b2a127836a.png

笔记整理:张嘉芮,天津大学硕士

链接:https://aclanthology.org/2021.findings-acl.278.pd

动机

传统的数据驱动方法不适用于零样本和少样本的场景。对于人类来说,常识知识是理解和推理的关键因素。在没有标注数据和用户立场的隐晦表达的情况下,引入常识性的关系知识作为推理支持,可以进一步提高模型在零样本和少样本场景下的泛化和推理能力。

亮点

本文的亮点主要包括:

(1)从外部结构知识库ConceptNet引入常识知识

(2)引入了一个基于图卷积网络的常识知识增强模块,利用关系子图的结构层和语义层信息,可以进一步增强模型的泛化和推理能力。

模型

问题定义:

形式上,280cd9674dbe4b5895657e202def41b8.png表示包含N个样本的零样本立场检测数据集,其中  为文档,  为对应主题,  为立场标签。该任务的目标是获得给定  的立场标签  。为了连接文档和主题,作者引入了一个从外部KG中提取的常识知识子图G = (V, E),其中V是概念的子集,E表示概念之间的关系。

框架:

模型整体框架如下:

81d35d9d4d1a74122a3b6d68741c95ef.png

1.BERT编码

作者使用预训练的语言模型BERT对文档x和主题t进行编码。具体来说,作者将x和t以以下格式连接成一个输入序列:[CLS] x [SEP] t [SEP]。然后,输入序列送入BERT获取上下文表示X = {x1 , … , xm}文档和T = {t1 , … , tn}为主题,m和n的长度是分别文档和主题。最后,可以得到文档和主题的平均表示  和  )。

2.Knowledge Graph Encoding with CompGCN

在介绍作者的图编码器之前,让作者首先描述从外部知识图构造关系子图的过程。作者采用ConceptNet作为知识图库G. ConceptNet由数百万个关系三元组组成,共包含34个关系。每个三元组都表示为R = (u, r, v),其中u是头部概念,r是关系,v是尾部概念。作者将文档和主题中的短语与来自ConceptNet的提到的概念集(Cd和Ct)进行匹配。为了从G中提取关系子图G = (V, E),作者找到Cd中的概念到Ct中的概念的两跳有向路径。路径上的所有概念构成概念集合V和E,由V内概念之间的所有边组成。此外,作者在任意概念对之间添加反向关系边,以改善信息流。

现有的关于GCNs的研究主要集中在非关系图上。因此,为了整合常识关系知识,作者利用了CompGCN ,这是图卷积网络(GCNs)的一种变体,它联合嵌入了子图G的节点和关系。图编码器由L层叠加的CompGCN层组成。节点和关系的特征均通过TransE嵌入进行初始化。作者通过聚合节点的邻居及其关系边的信息来更新节点表示。形式上,节点的更新方程定义为:

这里φ是一个基于平移理论(Bordes et al., 2013)的实体-关系复合运算,其形式为减法:

fe18fc64806cafaeba38feefcc1c0c83.png

将关系嵌入变换如下:

da67bed6c1acac432399670f275af3f4.png

然后,作者得到Cd和Ct的节点表示Hd和Ht。为了聚合合理的关系信息,作者通过执行缩放的dot - product attention计算Cd的平均关系表示  ,以  为键,Hd为查询和值。同样,作者得到Ct的平均关系表示  。

3.立场分类

将纯文本的表示(即  和  )与关系表示(即  和  )连接起来,以充分利用文本信息和图结构信息。然后,通过softmax函数将连接的表征输入到双层多层感知(MLP)中,以预测立场标签:

2fb1b08a92c6438809bce60791d7d09b.png

最后,利用多类交叉熵损失对网络参数进行训练。

实验

1.数据集:VAST

60432bad4889f28ec57f7642ff4ec4f8.png

2.总体结果

0dad4340c72cbaf628fb5788301101f7.png

我们的模型和基线的总体结果如表2所示。我们的模型在很大程度上优于所有基线,这可以说明结合丰富的常识知识以关系图的形式是有效的。此外,我们观察到所有基于bert的基线的性能都更差。对于零样本的主题,赞成的例子多于反对的例子。一种可能的解释是反面例子中有更多的否定词,这在语义上更容易识别。我们的模型在零样本和少样本的情况下都带来了显著的平均改善,这表明来自外部知识库的关系信息可以增强归纳推理能力。相对于BERT-GCN只对节点聚合建模,我们的模型充分利用了关系信息,对整体模型做出了很大贡献。

总结

本文阐述了在零样本和少样本立场检测中引入常识知识的必要性,我们提出了一种常识知识增强的方法,它促进了关系知识的集成,进一步加强了模型的归纳推理能力。大量的实验表明,我们提出的模型取得了最先进的成果。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

7305bb507ab4b1bc3aeebfa04afc74a1.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.exyb.cn/news/show-4579341.html

如若内容造成侵权/违法违规/事实不符,请联系郑州代理记账网进行投诉反馈,一经查实,立即删除!

相关文章

盘点 35 个 Apache 顶级项目,我拜服了…

原文 盘点 35 个 Apache顶级项目 文章目录Apache 软件基金会顶级开源项目基础组件项目1、Apache(httpd)2、Tomcat3、Commons4、POI5、HttpComponents6、logging services7、Ant8、Maven9、SubversionWeb 项目10、Struts11、FreeMarker12、Velocity13、Ta…

GitHub 热门项目:机器学习编程 100 天

(点击上方公号,快速关注我们)整理:Python开发者(id:PythonCoder)推荐一个 GitHub 热门项目:100 Days of ML Coding | 机器学习编程 100 天链接:https://github.com/Avik…

推荐GitHub上几个比较热门的开源项目,记得收藏下!!!

来自:开源最前线(ID:OpenSourceTop) 废话少说,直接来干货1terminalhttps://github.com/microsoft/terminal Star 42377Windows Terminal 是一个全新的,现代的,快速,功能强大且高效的…

GitHub热门项目 | PyTorch 资源大全,7400多星

整理:Python开发者(id:PythonCoder)PyTorch 是一个开源的深度学习框架,能够在强大的 GPU 加速基础上实现张量和动态神经网络。有下面这些公司/机构在用 PyTorch。GitHub 上有个热门项目,汇集综合了 PyTorch…

CTOlib码库介绍(GitHub热门项目收录网站)

网站链接:https://www.ctolib.com/ CTOlib码库每日更新收录GitHub上各编程语言的热门项目、活跃项目、教程等资源,目前(2020.2.12)已经收录了56493个,共659个分类。 网站更新挺快的,画面整洁清新&#xf…

爬取github上热门项目并绘制图表

github上的项目都存储在仓库中,本篇文章编写了一个程序可自动获取这些项目的具体信息,并将信息可视化展示出来。 1.使用API调用请求数据并处理API响应 直接在浏览器中输入https://api.github.com/search/repositories?qlanguage:python&sortstars 通…

盘点5月份GitHub上最热门的开源项目

又到了为大家盘点5月份GitHub最热门的开源项目的时候了,一起来看看你都知道哪些,或者有哪些你已经在使用的了。 1、terminal https://github.com/microsoft/terminal Star 42377 Windows Terminal 是一个全新的,现代的,快速&am…

【年度盘点】10大最热门Python项目回顾

这10个项目,约有270000人学习过。今天给大家盘点一下实验楼最热门的10个Python练习项目。第二名是《200 行 Python 代码实现 2048》,第三名是《Python3 实现火车票查询工具》。有没有学过5门以上的同学?10. Python 气象数据分析 当前学习…