gpt4 book ai didi

PYTHON:从 txt 文件中删除 POS 标签

转载 作者:行者123 更新时间:2023-11-28 22:00:10 25 4
gpt4 key购买 nike

我有以下 txt 文件,其中包含每个单词的 POS ( Part of Speech) 标签。

Needless/jj to/to say/vb ,/, I/ppss was/bedz furious/jj at/in this/dt unparalleled/jj intrusion/nn upon/in free/jj enterprise/nn ./. How/wrb dared/vbn they/ppss

有没有办法读取没有POS标签的文件,所以结果会是:

不用说,我对这种对自由企业的空前侵犯感到愤怒。他们怎么敢

所以,基本上我想删除 / 之后的任何字符。

words = re.findall('\w+',open(input_file).read())

上面的代码会去掉/但 jj , ppss 等缩写仍然出现。那么,如何删除/后跟任何字符。

最佳答案

这够好吗?

>>> import re
>>> s = 'Needless/jj to/to say/vb ,/, I/ppss was/bedz furious/jj at/in this/dt unparalleled/jj intrusion/nn upon/in free/jj enterprise/nn ./.'
>>> re.sub(r'/[^\s]+','',s)
'Needless to say , I was furious at this unparalleled intrusion upon free enterprise .'

这只是删除所有以 / 开头的文本,直到它找到空格。

关于PYTHON:从 txt 文件中删除 POS 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15365046/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com