gpt4 book ai didi

python - 将 str 中的索引转换为 bytearray 中的索引

转载 作者:太空狗 更新时间:2023-10-30 02:37:53 26 4
gpt4 key购买 nike

我有一些文本,对其进行处理并找到文本中某些单词的偏移量。这些偏移量将被另一个应用程序使用,并且该应用程序将文本作为字节序列进行操作,因此 str 索引将是错误的。

示例:

>>> text = "“Hello there!” He said"
>>> text[7:12]
'there'
>>> text.encode('utf-8')[7:12]
>>> b'o the'

那么如何将字符串中的索引转换为编码字节数组中的索引?

最佳答案

对子字符串进行编码并获取它们的字节长度:

text = "“Hello there!” He said"
start = len(text[:7].encode('utf-8'))
count = len(text[7:12].encode('utf-8'))
text.encode('utf-8')[start:start+count]

这给出了b'there'

关于python - 将 str 中的索引转换为 bytearray 中的索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48770843/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com