- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在使用阿拉伯语文本,我想删除阿拉伯语标点符号示例:
s="أهلاً بالعالم في هذه التجربة ! علامات ،الترقيم ؟ ,? لا .اتذكرها"
我希望输出删除 "؟ ، "
也是因为当我使用时:
import string
tr= str.maketrans("","", string.punctuation)
输出是 'أهلاً بالعالم وي هذه التوربة علامات 负责لا اتذكرها'
最佳答案
string.punctuation
常量仅包含 ASCII 中定义的标点字符,它甚至不包括拉丁脚本中使用的所有符号(例如,“花哨的引号”如 «» 丢失)。
如果您不想自己创建所有标点字符的列表(我不会),您可以使用 Unicode character property决定一个字符是否是标点符号。内置的 unicodedata
模块让您可以访问这些信息:
>>> import unicodedata as ud
>>> for c in 'abc: قيم ؟':
... print((c, ud.category(c))
a Ll
b Ll
c Ll
: Po
Zs
ق Lo
ي Lo
م Lo
Zs
؟ Po
所有类别都是双字母代码,例如“Ll”代表“字母,小写”或“Po”代表“标点符号,其他”。所有标点字符都有一个以“P”开头的类别。
您可以使用此信息过滤掉标点符号(例如,使用生成器表达式):
>>> s = "أهلاً بالعالم في هذه التجربة ! علامات ،الترقيم ؟ ,? لا .اتذكرها"
>>> ''.join(c for c in s if not ud.category(c).startswith('P'))
'أهلاً بالعالم في هذه التجربة علامات الترقيم لا اتذكرها'
关于 python 3 : Remove Arabic Punctuation,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48496869/
import urllib2,sys from bs4 import BeautifulSoup,NavigableString from string import punctuation as p
假设这是我们的文本: text = 'After 1992 , the winter and summer Olympics will be held two years apart , with t
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
有人知道从 SQL Server 字段中删除标点符号的好方法吗? 我在想 UPDATE tblMyTable SET FieldName = REPLACE(REPLACE(REPLACE(Field
我感觉标点符号能够访问本地存储数据,而 Java KafkaStreams 库正在重建它并重播更改日志主题中的项目 让我们描述一下我们的场景:我有一个 KafkaStreams 应用程序 A(用 Ja
我有以下接口(interface)实现: package io.khinkali.topology; import org.apache.kafka.streams.processor.*; publ
我很困惑为什么这段代码不能按我想要的方式工作。我正在读取 txt 文件并将每个项目(逗号分隔)打印到新行上。每个项目都用“”包围,并且还包含标点符号。我正在尝试删除这个标点符号。我熟悉 string.
我想检查句子结构的质量。具体来说,我想看看最终用户是否在标点符号后输入空格。我也可以使用 NLP 库或简单的 java 正则表达式解决方案。 例如: “嗨,我叫汤姆·克鲁斯。我喜欢电影” “嗨,我叫汤
我正在寻找诸如之类的句子 Bachelors Degree in early childhood teaching, psychology 我使用斯坦福解析器对文本进行注释。 然后,我迭代每个句子并使
我有一个字符串,我想用它删除所有标点符号。我目前使用: import string translator = str.maketrans('','', string.punctuation) name
print string.punctuation 看起来像这样: !"#$%&'()*+,-./:;?@[\]^_`{|}~ 我想知道我们是否可以在其中添加更多标点符号,例如像这样的中文句号:“。”
我正在使用阿拉伯语文本,我想删除阿拉伯语标点符号示例: s="أهلاً بالعالم في هذه التجربة ! علامات ،الترقيم ؟ ,? لا .اتذكرها" 我希望输
我正在尝试查找句子中的最后一个标点符号或空格字符。 鉴于我有这句话,"Hello! What is your name?" 我希望正则表达式返回 ? 的索引, 但我的正则表达式返回 ! 的索引 我的尝
我正在将数据从 SQL Server 表导出到 .csv 文件,然后我使用 sp_send_email 将数据通过电子邮件发送给该文件。 我的问题是这个值: Cantata Number 212 "P
在流应用程序中的单个任务中,以下两个方法是否独立运行(意味着“process”方法正在处理来自上游源的传入消息,“punctuate”方法也可以根据指定的时间表并行运行,并且WALL_CLOCK_TI
我试图弄清楚如何打开一个文件,将文件中的所有字母变成小写,然后取出所有标点符号。我尝试了一些在网上和书中看到的东西,但我似乎无法弄清楚。 import string def ReadFile(File
根据各种documentation ,要匹配任何标点符号我需要使用“\p{P}”模式 #include #include ... std::string str = "Hello'\"#%&!.:
我正在尝试使用 javascript 的 RegExp 来匹配完整的单词,但是当这些单词以标点符号作为边界时它不起作用。 IE。 (new RegExp("\\b"+RegExp.escape("wh
我正在尝试将旧的 phpBB 论坛数据库移动到新服务器。因此,当我下载 .sql 文件时,我尝试通过 phpMyAdmin 面板将其上传到新数据库。这是我收到的错误: Error There seem
How????are!!!you 我想将字符串拆分为 ['How','are','you']。 我试过以下正则表达式: \?*|\!* 这是行不通的。但是,以下正则表达式有效: \?+|\!+ 有人给
我是一名优秀的程序员,十分优秀!