python - 当我看到特殊的 eol 字符时，如何使用 Python 识别它？-6ren

python - 当我看到特殊的 eol 字符时，如何使用 Python 识别它？

转载作者：行者123 更新时间：2023-12-01 05:36:10

26

4

我正在使用 Python 抓取一组原始 pdf 文件。让他们发短信后，我很难弄清楚行尾。我无法弄清楚行分隔符是什么。问题是，我还是不知道。

这不是'\n'，或者，我不认为是'\r\n'。然而，我已经成功地分离出这些特殊字符之一。我确实将其保存在内存中，通过调用 my_str.replace(eol, '')，我可以从我的一个文件中删除所有这些字符。

所以我的问题是开放式的。当谈到unicode之类的时候我有点迷失了。如何在我的文件中识别这个字符而不诉诸一些荒谬的事情，比如序列化它然后读入它？有没有办法我可以将其作为代码引用？我无法让 Python 产生它实际上是什么。如果我打印它，或者调用 unicode(special_eol) ，我所看到的只是其功能用法中的字符作为换行符。

请帮忙!谢谢，如果我遗漏了一些明显的东西，抱歉。

最佳答案

要确定具体是什么字符，您可以使用 str.encode('unicode_escape') 或 repr()获取(在 Python 2 中)字符的 ASCII 可打印表示形式:

>>> print u'☃'.encode('unicode_escape')
\u2603
>>> print repr(u'☃')
u'\u2603'

关于python - 当我看到特殊的 eol 字符时，如何使用 Python 识别它？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18997829/

26

4

0

文章推荐： python - 在 Python 中使用 Pandas/matplotlib 更改 X 轴标签

文章推荐： python - 如何在 Python 中将文件条目拆分为字符串列表？

文章推荐： python - 在python中使用lxml添加xml前缀声明

文章推荐： asp.net - 通过按钮触发 AsyncFileUpload 控件

r - 看到 R 字符串的确切字节序列了吗？
如何获取特定 UTF-8 字符串的字节序列？我看到正则表达式引擎中的某些错误仅在某些边缘情况下才会触发，我想确切地知道它正在处理哪些数据。最佳答案也许 charToRaw ? > charToRa
java - 看到 Java 程序运行时变量值发生变化吗？
考虑一个具有许多变量的 java 程序，其中一些是循环计数器，我希望看到这些变量随时间变化的值，而不是在代码中到处放置 print 语句。为什么？我认为它可以帮助我轻松调试。 Example- in
javascript - 看到 JavaScript 正在创建的线程了吗？
有没有办法查看 JavaScript 正在创建的“线程”？例如，如果我有一个附加到 DOM 元素的事件处理程序，我假设 JavaScript 会隐式地创建一个新线程来在后台运行该代码？如果是这样，有没
java - 看到 InvokingTargetException 异常
我正在使用反射 API 来调用类运行时并调用其方法。但我看到 java.lang.reflect.InitationTargetException 异常。我需要调用一个名为 - TestClass
windows - 命令脚本退出代码未被同一行 && 或 || 看到？
考虑一个名为 t.cmd 的命令脚本，它只包含以下两行: @exit /b 123 @echo If you see this, THEN EXIT FAILED.. 因此，该脚本只是将脚本执行过程的
ruby - 看到 Ruby 的内幕了吗？
我最近一直在努力学习编程语言实用学第 3 版，以了解更多关于语言在底层如何工作的信息，并且通过查看由真正基本的 GCC 编译的 C 代码生成的程序集，我获得了很多进展.我开始对 C 系列的静态语言越来
flash - 如何让 QtWebKit 看到 Flash？
最简单的制作方法是什么QWebView识别并正确加载网页上的 Flash？最佳答案似乎只需两行即可实现(当然，假设目标系统上安装了闪存): QWebSettings *settings = QWe
vba - VBA，Outlook，看到“人民日历”
我想通过编程（使用VBA）访问其他人与我共享的日历。它们在我的Outlook中的“人民日历”下列出。我在网上搜索了此内容，所有建议所做的仅使我感到困惑。如何从“人的日历”中获取共享给我的所有日历的
mongodb-compass - 看到/设置MongoDB Compass用户？
使用MongoDB Compass，可以看到数据库用户或创建新用户吗？最佳答案香港专业教育学院在命令行上使用以下命令进行管理: mongo use (my database name) db.cr
xml - 除非我在oXygen上手动编辑文件，否则eXist-db不会对通过XQuery更新插入添加的新记录进行索引(“看到”)
我正在CentOS 7.4.1708（核心），Java（TM）SE运行时环境（内部版本1.8.0_152-b16）上运行eXist-db 3.6.1。我希望能够在person.xml中的最后一个记录之
sql - 在事务提交之前，在事务中进行的插入是否可以通过 SELECT 看到
我需要确认。客户端 1 在事务内的表中插入行。客户端 2 使用 SELECT 请求该表。如果在此客户端上隔离级别设置为 READ COMMITTED，您能否确认 SELECT 不会返回客户端 1
python - 如何让 Python 看到 librt？
我刚刚安装了 python-dev: $ sudo apt-get install python-dev 这样我就可以开始使用 P4Python 了。但是当我尝试导入 P4 时，我得到: Traceb
c++ - 如何让 libtorrent 看到 boost ？
我正在使用 msys 和 mingw 编译 libtorrent-rasterbar-0.16.16。./configure 运行良好，直到它进入 boost 库检查。我有 boost 1.51，我设
go - Travis 看到 GO 函数的旧签名并且不会构建
我在 GO 项目的 Travis CI 上有一个奇怪的行为。 [这里] 失败了，提示一个函数只接受 1 个参数并用 2 个参数调用。 src/finances-service/main.go:45:1
java - 看到 enum 后对 Java 中的类型声明感到困惑
这个问题已经有答案了: What are enums and why are they useful? (27 个回答) 已关闭 4 年前。作为 Java 初学者，我接触到了枚举，这让我对类型声明感
facebook - 为什么我的 Facebook 个人资料无法从外部(注销时)看到？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 11 年前。 Improve thi
javascript - preactjs 看到 [Object object] 而不是链接
我正在使用 preactjs 创建我的应用程序。最重要的是，我正在使用剑道网格。在网格内，我想显示一个超链接。如果用户点击链接，它应该改变路线。为了呈现链接，我使用了 preact-router。这
node.js - 看到 Node.js 中的函数签名了吗？
有没有办法只查看 Node.js 中的函数签名？我知道 fn.toString() 但不需要所有代码，只需要签名。最佳答案 var source = fn.toString(); var signa
ruby - 让 Vim 看到 RVM ubuntu
如何设置 vim 以查看我在 ubuntu 上安装的 ruby rvm。 rvm 已安装，ruby 从终端返回。 renshaw@renshaw-TravelMate-5740G:~$ ruby
android - 试图防止 OutOfMemoryError 看到 MAT - Android
我试图在我的 Android 应用程序中防止 OutOfMemoryError。我已经阅读了很多帖子，但我仍然无法解决。该应用程序有后台 Activity ，所以我认为这是主要问题。 OutOfMe

首页

博学

6Ren·AI

商城

python - 当我看到特殊的 eol 字符时，如何使用 Python 识别它？