gpt4 book ai didi

python - 我文本中的分隔符是什么

转载 作者:太空宇宙 更新时间:2023-11-04 07:43:04 25 4
gpt4 key购买 nike

我有一个很长很乱的文件,我的 friend 告诉我他用制表符分隔了那个文件..但是当我这样做时:

  tokens = line.split("\t")

它不会 split ...

但我不知道也许我遗漏了一些东西.. 我的 friend 似乎很确定他的文件是用制表符分隔的。而且它看起来也是用制表符分隔的

示例文件

10      AccessibleComputing     0       381202555       2010-08-26T22:38:36Z    OlEnglish       7181920 #F3#    [[Help:Reverting|Reverted]] edits by [[Special:Contributions/76.28.186.133|76.28.186.133]] ([[User talk:76.28.186.133|talk]]) to last version by Gurch  #REDIRECT#F0#[[Computer#F0#accessibility]]#F0#{{R#F0#from#F0#CamelCase}}        lo15ponaybcg2sf49sstw9gdjmdetnk ,Computer_accessibility

有没有办法知道 python 中隐藏的分隔符?

也许用另一种格式对字符串进行编码......?

最佳答案

仅按空格分割:

line.split()

str.split()没有参数将拆分可变宽度的空格,并根据需要删除前导和尾随空格。空白是任何制表符、空格、换行符或回车符:

>>> '10      AccessibleComputing     0       381202555       2010-08-26T22:38:36Z    OlEnglish       7181920 #F3#    [[Help:Reverting|Reverted]] edits by [[Special:Contributions/76.28.186.133|76.28.186.133]] ([[User talk:76.28.186.133|talk]]) to last version by Gurch  #REDIRECT#F0#[[Computer#F0#accessibility]]#F0#{{R#F0#from#F0#CamelCase}}        lo15ponaybcg2sf49sstw9gdjmdetnk ,Computer_accessibility'.split()
['10', 'AccessibleComputing', '0', '381202555', '2010-08-26T22:38:36Z', 'OlEnglish', '7181920', '#F3#', '[[Help:Reverting|Reverted]]', 'edits', 'by', '[[Special:Contributions/76.28.186.133|76.28.186.133]]', '([[User', 'talk:76.28.186.133|talk]])', 'to', 'last', 'version', 'by', 'Gurch', '#REDIRECT#F0#[[Computer#F0#accessibility]]#F0#{{R#F0#from#F0#CamelCase}}', 'lo15ponaybcg2sf49sstw9gdjmdetnk', ',Computer_accessibility']

关于python - 我文本中的分隔符是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15191728/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com