使用DeepKE训练命名实体识别模型DEMO（官方DEMO）

转载作者：撒哈拉更新时间：2024-10-10 18:20:49

57

4

使用DeepKE训练命名实体识别模型DEMO（官方DEMO）

说明：

首次发表日期：2024-10-10
DeepKE资源：
- 文档： https://www.zjukg.org/DeepKE/
- 网站： http://deepke.zjukg.cn/
- cnschema： http://cnschema.openkg.cn/

如果需要，设置Github镜像

git config --system url."https://githubfast.com/".insteadOf https://github.com/

如果要取消，则输入：
git config --system --unset url.https://githubfast.com/.insteadof

创建conda环境

conda create -n deepke python=3.8
conda activate deepke

# 安装torch
pip install torch==1.11.0+cu113 torchvision==0.12.0+cu113 torchaudio==0.11.0 --extra-index-url https://download.pytorch.org/whl/cu113

# 使用阿里云镜像安装torch 1.11.0
# pip install https://mirrors.aliyun.com/pytorch-wheels/cu113/torch-1.11.0+cu113-cp38-cp38-linux_x86_64.whl https://mirrors.aliyun.com/pytorch-wheels/cu113/torchvision-0.12.0+cu113-cp38-cp38-linux_x86_64.whl https://mirrors.aliyun.com/pytorch-wheels/cu113/torchaudio-0.11.0+cu113-cp38-cp38-linux_x86_64.whl -i https://mirrors.aliyun.com/pypi/simple/

安装DeepKE:

git clone https://github.com/zjunlp/DeepKE.git
cd DeepKE

pip install pip==24.0

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
python setup.py install
python setup.py develop

pip install prettytable==2.4.0
pip install ipython==8.12.0

下载数据集

# apt-get install wget
cd example/ner/standard
wget 120.27.214.45/Data/ner/standard/data.tar.gz
tar -xzvf data.tar.gz

可以看到data文件夹下有:

train.txt: Training set
valid.txt : Validation set
test.txt: Test set

配置wandb

在 https://wandb.ai/ 上注册账号，并新建一个project，取一个名字，比如：deepke-ner-official-demo 。

打开 https://wandb.ai/authorize 获取 API key 。

运行 wandb init，输入刚获取的 API key 和创建的project 。

运行训练和预测

删除之前训练时保存的checkpoints和logs文件夹（如果有）:

rm -r checkpoints/
rm -r logs/

lstmcrf

打开 example/ner/standard/run_lstmcrf.py，确保wandb和yaml库有正常导入:

import wandb
import yaml

修改wandb的project名称:

if config['use_wandb']:
    wandb.init(project="deepke-ner-official-demo")

修改 example/ner/standard/conf/config.yaml 中的 use_wandb 为 True.

如果需要使用多个GPU训练，修改 example/ner/standard/conf/train.yaml 中的 use_multi_gpu 为 True 。

开始训练:

python run_lstmcrf.py

>> total: 109870 loss: 27.181508426008552
              precision    recall  f1-score   support

       B-LOC     0.8920    0.8426    0.8666      1951
       B-ORG     0.8170    0.7439    0.7787       984
       B-PER     0.8783    0.8167    0.8464       884
       I-LOC     0.8650    0.8264    0.8453      2581
       I-ORG     0.8483    0.8365    0.8424      3945
       I-PER     0.8860    0.8436    0.8643      1714
           O     0.9861    0.9912    0.9886     97811

    accuracy                         0.9732    109870
   macro avg     0.8818    0.8430    0.8618    109870
weighted avg     0.9727    0.9732    0.9729    109870

用于的预测文本保存在example/ner/standard/conf/predict.yaml中，修改为如下:

text: "“热水器等以旧换新，节省了2000多元。”10月3日，在湖北省襄阳市的一家购物广场，市民金煜轻触手机，下单、付款、登记。湖北着力推动大规模设备更新和消费品以旧换新。“力争到今年底，全省汽车报废更新、置换更新分别达到4.5万辆、12.5万辆，家电以旧换新170万套。”湖北省商务厅厅长龙小红介绍。"

运行预测:

python predict.py

NER结果

[('湖', 'B-LOC'), ('北', 'I-LOC'), ('省', 'I-LOC'), ('襄', 'B-LOC'), ('阳', 'I-LOC'), ('市', 'I-LOC'), ('场', 'I-LOC'), ('煜', 'I-PER'), ('湖', 'B-ORG'), ('北', 'I-ORG'), ('省', 'I-ORG'), ('商', 'I-ORG'), ('务', 'I-ORG'), ('厅', 'I-ORG'), ('厅', 'I-ORG'), ('龙', 'B-PER'), ('小', 'I-PER'), ('红', 'I-PER')]

bert

修改 example/ner/standard/conf/config.yaml中的hydra/model为bert.

bert的超参设置在 example/ner/standard/conf/hydra/model/bert.yaml，如有需要可以修改.

修改 example/ner/standard/conf/config.yaml 中的 use_wandb 为 True.

修改 example/ner/standard/run_bert.py 中的wandb的project名称:

    if cfg.use_wandb:
        wandb.init(project="deepke-ner-official-demo")

根据需要，修改example/ner/standard/conf/train.yaml中的train_batch_size，对于bert来说推荐不小于64 。

开始训练:

export HF_ENDPOINT=https://hf-mirror.com
python run_bert.py

w2ner

w2ner是一个新的SOTA模型.

基于W2NER (AAAI’22)的应对多种场景的实体识别方法 (详情请查阅论文Unified Named Entity Recognition as Word-Word Relation Classification). 。

命名实体识别 (NER) 涉及三种主要类型，包括平面、重叠（又名嵌套）和不连续的 NER，它们大多是单独研究的。最近，人们对统一 NER 越来越感兴趣， W2NER使用一个模型同时处理上述三项工作.

由于使用单卡GPU，修改example/ner/standard/w2ner/conf/train.yaml中的 device 为 0.

修改example/ner/standard/w2ner/conf/train.yaml中的data_dir和do_train:

data_dir: "../data"
do_train: True

以便使用之前下载的数据集和开始训练.

运行训练:

python run.py

最后此篇关于使用DeepKE训练命名实体识别模型DEMO（官方DEMO）的文章就讲到这里了,如果你想了解更多关于使用DeepKE训练命名实体识别模型DEMO（官方DEMO）的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

57

4

0

文章推荐： Gradio5稳定版正式发布

文章推荐： Python：条件分支if语句全讲解

文章推荐： Ewald求和在分子静电势能计算中的应用

文章推荐： 3个步骤轻松集成PushKit，实现App消息推送

c# - 为什么这不起作用？实体.CurHP - 实体.RIntDamage
都是整数，但一直报错 "Only assignment, call, increment, decrement, await, and new object expressions can be us
c# - 选择具有所有给定标签的 EF 实体(其中标签是 EF 实体)
我有以下情况:一个“对话”实体/表，它有多个关联的标签。Tag 也是一个实体/表 - key/id 是 tagName(一个字符串)。在客户端 (javascript)，我在处理标签时使用字符串数组
java - 是否有基于 hibernate 实体 XML 生成 java 源代码(实体)类的 Maven 插件？
我想通过 maven java 源代码生成器自动生成 java 源代码。我想通过查看一个大实体 xml 文件来创建实体类，该文件将包含系统中的所有实体和实体关系。据我搜索，目前maven中没有这样的插
java - EJB 2.1 实体 bean 与 EJB 3.0 实体 bean
我有一段时间有这个疑问，有人说 EJB 3.0 中没有所谓的实体 bean。有没有可能这样说，EJB 3.0 使用 JPA 来持久化数据并且没有对以前版本(EJB 2.1)中的实体 bean 进行增强
ios - Swift 3 核心数据 - 实体(上下文 :) vs Entity(entity: Location. 实体()，insertInto:上下文)
我观看了关于 Core Data 的 2016 WWDC 视频并查看了各种教程。我见过使用 Core Data Framework 创建对象以持久保存到 managedObjectContext 中的
07、DTD 实体
实体(entites) 用于定义引用普通文本或特殊字符的快捷方式的变量，可在内部或外部进行声明实体引用是对实体的引用声明一个内部实体语法： <!ENTITY 实体名称 "
java - hibernate !实体
This page建议 !ENTITY: If you want to avoid duplication, consider using XML entities (for example, [ ]
entity - 差异聚合根/实体
我正在努力解决这个问题:如何判断一个概念是聚合根还是只是一个实体(属于 AR 的一部分)？ : 他们都有 ID 它们都是由实体或值对象组成也许如果我需要引用其他 AR 中的实体，那么我需要将其设为
没有关系的 Symfony 实体
我使用 Symfony2 和 Doctrine，我有一个关于实体的问题。出于性能方面的考虑，我想知道是否可以在不进行所有关联的情况下使用实体？目前，我还没有找到另一种方法来创建继承带有关联的类的模
附加文件符号的 HTML 实体？
我已经尝试在 HTML 中包含以下代码，用于附加文件符号。但它显示一个空的白框。 📎 📎 📎 是否有替代的 HTML 附加文件符号实体？如果没有，我们可以手动创建
没有持久化的 Grails 实体
我在 grails 中有一个域类......我如何让 gorm 在创建数据库时忽略这个实体？就别管它了。最佳答案如果我理解，你不想从域类创建表？如果是，请在域类中使用此代码: static map
entity - 差异聚合根/实体
我正在努力解决这个问题:如何判断一个概念是聚合根还是只是一个实体(属于 AR 的一部分)？ : 他们都有 ID 它们都是由实体或值对象组成也许如果我需要引用其他 AR 中的实体，那么我需要将其设为
附加文件符号的 HTML 实体？
我已经尝试在 HTML 中包含以下代码，用于附加文件符号。但它显示一个空的白框。 📎 📎 📎 是否有替代的 HTML 附加文件符号实体？如果没有，我们可以手动创建
Java 实体 - 存储日期
如何在我的实体中以 14-04-2017 格式存储日期？但我必须从字符串中解析它。 SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-
c# - 实体 - 两个连接表是什么类型
我需要从两个连接表中获取数据。数据集是什么类型？我是否需要创建一个包含这两个表中的属性的类以用于数据集类型，或者我可以使用实体模式中的类型。我如何修改我的方法才能正常工作？ public static
php - Cakephp3将多个Mysql表标准化为1个模型表/实体
好的，我们正在尝试建立一个中央站点来查看来自销售我们产品的多个供应商的数据。这些多个供应商使用不同的销售系统(确切地说是两个不同的系统)，因此每个数据库看起来完全不同。我们与他们的数据库同步，因此数据
javascript - Backbone 实体
我是 backbone 的新手。但是当我研究模型实体时，我不明白一些事情。如果我们可以像 java 或 C# 这样的标准语言一样定义模型属性，那就太好了。有没有可能是这样的。所以我的想法是这样的: M
Android - 在可绘制对象中获取形状颜色/实体
我想获取存储在可绘制的 xml 文件中的形状的颜色。我来到了将 Drawable 存储在 Drawable 变量中的步骤，所以，现在我想获取形状的颜色(纯色标签)。有什么建议吗？最佳答案 Gra
java - 实体、服务类和命令对象的最佳实践问题
实体是直接映射到我们的数据库(我们用于 Hibernate)的类。在调用 DAO 之前，我们的服务类包含这些实体的业务逻辑。我们还有命令对象，它们是与特定 View 相关的 POJO。有人告诉我实
C# 函数返回通用对象/实体
在我的应用程序中，我需要显示不同存储过程返回的记录列表。每个存储过程返回不同类型的记录(即列数和列类型不同)。我最初的想法是为每种类型的记录创建一个类，并创建一个函数来执行相应的存储过程并返回 Li

首页

博学

6Ren·AI

商城