python - 为什么我的正则表达式可以在 regexr.com 上运行，但从命令行运行时会抛出错误？-6ren

python - 为什么我的正则表达式可以在 regexr.com 上运行，但从命令行运行时会抛出错误？

转载作者：行者123 更新时间：2023-12-01 07:32:03

25

4

我需要使用正则表达式来解决两个问题来定位文件路径。

1) 主要问题:我收到一条我不明白的错误消息。2)在我更改一些小内容之前，脚本会运行，但正则表达式搜索没有返回任何内容。

在 regexr.com 和 pythex.org 中测试时，正则表达式确实有效，其中匹配项位于正确的位置。当我从命令行运行它时它不起作用。

这是我要定位的正则表达式:

('([a-zA-Z]:\\)([a-zA-Z0-9 ]*\\)*([a-zA-Z0-9 ]*\/)*([a-zA-Z0-9 ])*(\.[a-zA-Z]*)*'

这是其使用的代码:

import os
import re

#run script from directory the script is in - place it in the dir being processed
start_path = os.path.dirname(os.path.realpath(__file__))
metadata_path = start_path + "\Metadata"

#change directory to the metadata folder where email.txt is
try:
    os.chdir(metadata_path)
except: print ('Could not change directory. Please try again.')

with open("email.txt", 'r', encoding = 'utf-8') as file:
    all_lines = file.readlines()
    no_header = all_lines[5:] #remove the header lines from email.txt
new_lines =[]
all_files=[]
unique_files =[]
for i in range(len(no_header)):#remove square charcter
    new_lines.append(re.sub('\S\-\d+', '',no_header[i]))

for i in range(len(new_lines)):#capture all the names of files containing personal emails
    test = re.search('([a-zA-Z]:\\)([a-zA-Z0-9 ]*\\)*([a-zA-Z0-9 ]*\/)*([a-    
    zA-Z0-9 ])*(\.[a-zA-Z]*)*',new_lines[i]) 
    print (test)

我收到错误消息“re.error:缺失)，位置 0 处未终止子模式”

它有均匀数量的括号，据我所知，它们似乎彼此匹配。我猜测这与我如何在模式中对事物进行分组有关。

就它什么都不返回而言，我是否错过了在线测试人员无法捕获的 python 特定规则？

谢谢!

最佳答案

我的猜测是它可能缺少 r 或者表达式中某处的括号:

测试

import re

regex = r"([a-zA-Z]:\\)([a-zA-Z0-9 ]*\\)*([a-zA-Z0-9 ]*\/)*([a-zA-Z0-9 ])*(\.[a-zA-Z]*)*"

test_str = "a:\\a\\a/a.a"

print(re.search(regex, test_str))

<小时/>

该表达式在 regex101.com 的右上角面板中进行了解释，如果您想探索/简化/修改它，请在this link中，如果您愿意，您可以观察它如何与一些示例输入匹配。

代码

import os
import re

#run script from directory the script is in - place it in the dir being processed
start_path = os.path.dirname(os.path.realpath(__file__))
metadata_path = start_path + "\Metadata"

#change directory to the metadata folder where email.txt is
try:
    os.chdir(metadata_path)
except: print ('Could not change directory. Please try again.')

with open("email.txt", 'r', encoding = 'utf-8') as file:
    all_lines = file.readlines()
    no_header = all_lines[5:] #remove the header lines from email.txt
new_lines =[]
all_files=[]
unique_files =[]
for i in range(len(no_header)):#remove square charcter
    new_lines.append(re.sub(r'\S\-\d+', '',no_header[i]))

for i in range(len(new_lines)):#capture all the names of files containing personal emails
    test = re.search(r'([a-zA-Z]:\\)([a-zA-Z0-9 ]*\\)*([a-zA-Z0-9 ]*\/)*([a-    
    zA-Z0-9 ])*(\.[a-zA-Z]*)*',new_lines[i]) 
    print (test)

关于python - 为什么我的正则表达式可以在 regexr.com 上运行，但从命令行运行时会抛出错误？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57168572/

25

4

0

文章推荐： jquery:从字符串分配事件

文章推荐： list - 如何将函数仅映射到列表中的某些元素？

文章推荐： jquery点击函数打印href问题

文章推荐： file - 谷歌云存储搜索文件

com - COM 内存泄漏的常见原因是什么？
COM 内存泄漏最常见的原因是什么？我读过将初始化的 CComBSTR 的地址作为 [out] 参数传递给函数会导致泄漏。我正在寻找像这样枚举其他常见的编程错误。最佳答案未能为 COM 对象使用
com - COM 中的内存管理
在COM服务器执行过程中分配一 block 内存，然后通过一个输出参数将该内存块传递给客户端是很常见的。然后，客户端有义务使用 CoTaskMemFree() 等方法释放该内存。问题是，这 bloc
com - MFC COM 或 ATL COM (ActiveX)
我有一些 MFC 代码(自定义 CWnd 控件和一些要公开的类)，我需要将它们制作成带有接口(interface)的 activex/COM 对象。使用 MFC 支持制作 ATL 项目并以这种方式制作
com - 制作一个 .com 程序来调用 .exe(比如 devenv.com)
Devenv.com 是 visual studio 命令行界面，当您键入 devenv/? 时，devenv 的帮助会出现在控制台上。但是，如果没有任何选项，devenv.com 只会调用 deve
com - 从 COM 库传递对 COM 接口(interface)的引用
如何将 COM 接口(interface)的引用作为 COM 库中的参数传递？这是示例: 1)客户端代码成功创建coclass并接收到pFunctionDiscovery中的接口(interface
django - 'foo.bar.com.s3.amazonaws.com' 不匹配 '*.s3.amazonaws.com' 、 's3.amazonaws.com'
我正在使用 django，我在 s3 中存储了诸如 imgs 之类的东西(为此我使用的是 boto)，但最近我收到了这个错误: 'foo.bar.com.s3.amazonaws.com' doesn
windows - 将 COM 对象导入 COM+ 应用程序，同时保留直接访问 COM 对象？
我已经使用组件服务 MSC 对话框创建了一个 COM+ 应用程序。我将一个现有的 COM 对象导入到这个新的 COM+ 应用程序中。我知道可以通过 COM+ 应用程序调用该 COM 对象。我可以简单
php - stackoverflow.com、airbnb.com、google+、facebook.com 等开发中使用的工具？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 11 年前。 Improve thi
c# - COM Interop 挂起会卡住整个 COM 系统。如何取消 COM 调用
我正在使用通过 COM Interop 包装器公开的第三方 dll。但是，其中一个 COM 调用经常卡住(至少从不返回)。为了至少让我的代码更健壮一些，我异步包装了调用(_getDeviceInfoW
php - 将 www.domain.com/example.com 重定向到 example.com
很多年前我读到有一个简单的 php 脚本可以将您的网站重定向到 http://example.com/google.com 到 google.com它适用于正斜杠右侧的任何域。我忘记了这个脚本是什么或
com - 进程外 COM 服务器的注册表项
我正在实现我的第一个进程外 COM 服务器(我的第一个 COM 服务器，就此而言)。我已经按照步骤编写了一个 IDL 文件，为代理/ stub DLL 生成代码，编译 DLL，并注册它。当我检查注册
com - COM RCW 上的地址
是否可以在未知接口(interface)上增加 RCW 引用计数？ (即不是底层 COM 对象的引用计数) 我有一些旧的 COM 服务器代码 int Method1(object comobject)
com - 大多数对象不支持 COM 聚合吗？
我注意到许多关于 COM 的书籍等都指出，在 COM 聚合中实现一个可用作内部对象的对象相对容易。但是，除非我遗漏了什么，否则聚合似乎只能在极其有限的场景中成功，因此只有在明确识别出这种场景时才应提供
com - 如何在运行时注册 COM 库？
假设我正在开发一个安装 COM 组件并安装程序注册它们的应用程序。这很好用。现在该软件需要从内存棒上运行。如何注册我的库运行时并确保在运行应用程序后清理注册表？最佳答案您总是在 XP 或更高版本
com - ActiveX/COM/VB6企业项目的生成过程
我们已经使用Microsoft的ActiveX/COM(VB6)技术开发了一个软件系统。去年，我对自动化构建过程和整个SCM越来越感兴趣。我集中搜索了网络的大部分内容，以获取有关如何使用基于COM的软
com - 避免 COM 编码
我对 com 线程模型有点困惑。我有一个 inproc 服务器，我想创建一个可从任何线程访问的接口(interface)，而不管 CoInitializeEx 中使用的线程模型和/或标志。当将接口
com - MSIX -> COM 服务器的本地激活权限
我的包以旁加载方式安装，并不断遇到特定于应用程序的权限错误。是的，许多人建议在 regedit 和组件服务中手动更改权限和所有者。我的应用实际上在组件服务(DCOMCNFG、DCOMCNFG -3
com - 应用程序不返回时指向 COM 对象的指针
我正在使用第三方应用程序，并调用创建的实例。我的 COM 对象。这个调用成功了，但是第三方应用程序上的函数没有返回指向创建对象的指针(我不知道为什么)。有没有办法获得指向我的对象的指针？为了澄清，
com - 使用 COM 互操作时如何管理对象生命周期？
我有一个用 C# 编写的托管 COM 对象和一个用 C++(MFC 和 ATL)编写的 native COM 客户端和接收器。客户端创建对象并在启动时向其事件接口(interface)提供建议，并在其
com - 为什么我不能注册我的 COM DLL？
我的应用程序需要注册两个 COM DLL。如果用户有必要的访问权限，它会自动完成，否则可以使用 regsvr32 完成。 . 现在在一些工作站上会发生以下情况: 开始cmd.exe作为管理员注册第一

首页

博学

6Ren·AI

商城

python - 为什么我的正则表达式可以在 regexr.com 上运行，但从命令行运行时会抛出错误？

测试

代码