gpt4 book ai didi

Python:替换重音符号(é 到 e)、删除 [^a-zA-Z\d\s] 和 lower() 的有效方法

转载 作者:太空狗 更新时间:2023-10-29 17:23:28 25 4
gpt4 key购买 nike

<分区>

使用 Python 3.3。我想执行以下操作:

  • 替换特殊字母字符,例如 e acute (é) 和 o带有基本字符的抑扬音符 (ô)(例如 ô 到 o)
  • 删除除字母数字和字母数字之间的空格之外的所有字符人物
  • 转换为小写

这是我目前所拥有的:

mystring_modified = mystring.replace('\u00E9', 'e').replace('\u00F4', 'o').lower()
alphnumspace = re.compile(r"[^a-zA-Z\d\s]")
mystring_modified = alphnumspace.sub('', mystring_modified)

我该如何改进?效率是一个大问题,特别是因为我目前正在循环内执行操作:

# Pseudocode
for mystring in myfile:
mystring_modified = # operations described above
mylist.append(mystring_modified)

有问题的文件每个大约有 200,000 个字符。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com