gpt4 book ai didi

python - 如何识别 python 字符串中的不可见字符?

转载 作者:太空狗 更新时间:2023-10-29 20:21:27 29 4
gpt4 key购买 nike

精简版

我正在检索一个数据库值,其中包含一个简短但完整的 HTML 结构。我想去掉所有的 HTML 标签,最后只得到一个值。围绕我的相关信息的 HTML 始终是相同的,我只需要弄清楚字符串包含什么样的换行符、制表符或空格,以便我可以进行匹配并将其删除。

有没有我可以在线粘贴字符串的地方,或者我可以通过其他方式检查字符串的实际内容,以便我能够将其删除?

长版,以及我已经尝试过的内容:

字符串是从 HP Quality Center 数据库中检索的,并打印在自动测试执行的控制台中,该字符串被解释为显示为两个空格。粘贴到word、eclipse或QC脚本编辑器中时,显示为换行符。

我尝试用 \n 替换空格, 双空格和 ¶ .什么都不管用。

我正在从一个有效的 VBScript 中翻译这个脚本。有问题的不可见字符定义为 vbcrlfVBCRLF那里。出于某种原因,他们在相关参数值之前的替换字符串中使用小写,而在我的相关子字符串之后的字符串中使用大写。它们被定义为变量,不在字符串本身内:<html>"&vbcrlf&"<body>"&vbcrlf&"<div ...

这个网站建议我应该使用\n https://answers.yahoo.com/question/index?qid=20070506205148AAmr92N ,正如他们所写:

vbCrLf = "\n" # Carriage returnlinefeed combination

虽然我对这里使用的大写/小写的不一致感到有点困惑......

编辑:

谷歌搜索回车换行组合后,我了解到它可以定义为 /r/n这里:Order of carriage return and new line feed .

但我花了很长时间才找到它,但它没有回答我的问题,即我如何才能更好地准确识别字符串包含哪种不可见字符。我会留下这个问题。

最佳答案

要查看字符串的内容(包括它的“隐藏”值),您总是可以这样做:

print( [data] )
# or
print( repr(data) )

如果您在评论中描述的系统中,您还可以:

with open('/var/log/debug.log', 'w') as fh:
fh.write( str( [data] ) )

然而,这只会让您大致了解您的数据是什么样子,但如果这能解决您的疑问或问题,那就太好了。如果您需要进一步的帮助,请编辑您的问题或提交新问题 :)

关于python - 如何识别 python 字符串中的不可见字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31341351/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com