gpt4 book ai didi

python - 在 Python 中迭代 append 到字符串的有效方法?

转载 作者:行者123 更新时间:2023-11-28 19:41:24 25 4
gpt4 key购买 nike

我正在编写一个 Python 函数来将文本拆分为单词,忽略指定的标点符号。这是一些工作代码。我不相信从列表中构造字符串(代码中的 buf = [])是有效的。有没有人建议更好的方法来做到这一点?

def getwords(text, splitchars=' \t|!?.;:"'):
"""
Generator to get words in text by splitting text along specified splitchars
and stripping out the splitchars::

>>> list(getwords('this is some text.'))
['this', 'is', 'some', 'text']
>>> list(getwords('and/or'))
['and', 'or']
>>> list(getwords('one||two'))
['one', 'two']
>>> list(getwords(u'hola unicode!'))
[u'hola', u'unicode']
"""
splitchars = set(splitchars)
buf = []
for char in text:
if char not in splitchars:
buf.append(char)
else:
if buf:
yield ''.join(buf)
buf = []
# All done. Yield last word.
if buf:
yield ''.join(buf)

最佳答案

http://www.skymind.com/~ocrow/python_string/讨论了在 Python 中连接字符串的几种方法并评估了它们的性能。

关于python - 在 Python 中迭代 append 到字符串的有效方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/653259/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com