gpt4 book ai didi

python - 如何使 XLRD 读取 XLSX 单元格中的超链接?

转载 作者:行者123 更新时间:2023-11-28 19:16:18 24 4
gpt4 key购买 nike

尽管此问题已在 2011 Getting a hyperlink URL from an Excel document、2013 Extracting Hyperlinks From Excel (.xlsx) with Python 和 2014 Getting the URL from Excel Sheet Hyper links in Python with xlrd 中在本论坛中提出,但这不是重复问题;仍然没有答案。在深入研究 xlrd 模块之后,似乎 Data_sheet.hyperlink_map.get((row, col)) 项目跳闸,因为“xlrd 无法读取没有 formatting_info 的超链接,目前 xlsx 不支持”@alecxe 在 Extracting Hyperlinks From Excel (.xlsx) with Python。问题:有人在从存储在 Excel 文件中的超链接中提取 URL 方面取得了进展吗?比如说,在所有客户数据中,有一列超链接。我正在考虑将 excel 工作表转储为 html 页面并按照通常的抓取(本地驱动器上的文件)进行操作的想法。但这不是生产解决方案。补充:是否有任何其他模块可以从超链接单元格上的 .cell(row,col).value() 调用中提取 url。有机械化的解决方案吗?非常感谢。

最佳答案

我在尝试从 xlsx 文件的单元格中获取超链接时遇到了同样的问题。我想到的解决方法是将 Excel 工作表简单地转换为 xls 格式,从中我可以毫不费力地获取超链接,完成编辑后,我将其格式化回原始 xlsx 文件。

我不知道这是否适合您的特定需求,或者格式的更改是否意味着一些我不知道的后果,但我认为值得一试。

关于python - 如何使 XLRD 读取 XLSX 单元格中的超链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33149929/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com