Tao Wu (吴涛)'s Homepage
“知识智能与安全计算研究组”
“智慧文博联合实验室”
主要内容与目标
命名实体识别:命名实体识别(Named Entity Recognition, NER)指的是文本中具有特定意义或者指代性强的实体
,学术上通常包括实体类、时间类、数字类三大类和人名、地名、组织机构名、时间、日期、货币、百分比七小类。
NER就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体。
关系抽取:关系抽取旨在从无结构化的自然语言文本中抽取出格式统一的实体关系,
便于海量数据的处理。融合图神经网络于关系抽取任务中,通过依赖关系树形成的计算图来构建分布式表示去解决关系抽取中特征表示的问题,
能够捕捉非局部的长距离依赖关系。
代表性算法
关系抽取:GCN、AGGCN
实体识别:BERT-BiLSTM-CRF、IDCNN-CRF、Attention-CRF、CNN-LSTM-CRF
实验环境、数据资源、评价指标
1.关系抽取
实验环境:Tensorflow、Pytorch、
数据集:TACRED、SEMEVAL
评价指标:精准率(precision)、召回率(recall)、F1值
2.实体识别
实验环境:Tensorflow、Pytorch、Keras+Keras-contrib
数据集:MSRA、Weibo、Chinese Resume、OntoNotes
评价指标:精准率(precision)、召回率(recall)、F1值
|