- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是初学者,学习 python 几个月是我的第一门编程语言。我正在寻找从文本文件中找到的模式。我的第一次尝试是使用正则表达式,它确实有效但有一个限制:
import re
noun_list = ['bacon', 'cheese', 'eggs', 'milk', 'list', 'dog']
CC_list = ['and', 'or']
noun_list_pattern1 = r'\b\w+\b,\s\b\w+\b,\sand\s\b\w+\b|\b\w+\b,\s\b\w+\b,\sor\s\b\w+\b|\b\w+\b,\s\b\w+\b\sand\s\b\w+\b|\b\w+\b,\s\b\w+\b,\saor\s\b\w+\b'
with open('test_sentence.txt', 'r') as input_f:
read_input = input_f.read()
word = re.findall(noun_list_pattern1, read_input)
for w in word:
print w
else:
pass
所以此时您可能会问为什么这段代码中没有列表,因为它们没有被使用。好吧,我一直在绞尽脑汁,尝试各种 for 循环和函数中的 if 语句来尝试找到复制正则表达式模式的原因,但使用列表。
正则表达式的局限性在于,在 `noun_list_pattern' 中多次出现的 \b\w+\w\
代码实际上只能找到单词 - 任何单词 - 而不是特定名词。这可能会引起误报。我想通过使用上面列表中的元素而不是正则表达式来进一步缩小范围。
因为我在正则表达式模式中实际上有 4 个不同的正则表达式(它包含 4 个 |
),所以我将在这里使用其中的一个。所以我需要找到一种模式,例如:
'noun in noun_list' + ', ' + 'noun in noun_list' + ', ' + 'C in CC_list' + ' ' + 'noun in noun_list
显然,上面引用的代码行不是真正的 python 代码,而是我对所需匹配的想法的表达。我说 noun in noun_list
我的意思是通过 noun_list 进行迭代; C in CC_list
是遍历CC_list; ,
是逗号和空格的文字字符串匹配。
希望我说清楚了!
这是我正在使用的 test_sentence.txt
文件的内容:
I need to buy are bacon, cheese and eggs.
I also need to buy milk, cheese, and bacon.
What's your favorite: milk, cheese or eggs.
What's my favorite: milk, bacon, or eggs.
最佳答案
稍微分解一下您的问题。首先,您需要一个模式来匹配您列表中的单词,但不能匹配其他单词。您可以使用交替运算符 |
和文字来完成此操作。例如,red|green|blue
将匹配 "red"
、"green"
或 "blue"
,但不是 "purple"
。使用该字符加入名词列表,并添加单词边界元字符和括号以对交替进行分组:
noun_patt = r'\b(' + '|'.join(nouns) + r')\b'
对你的连词列表做同样的事情:
conj_patt = r'\b(' + '|'.join(conjunctions) + r')\b'
您要进行的整体匹配是“一个或多个 noun_patt
匹配,每个可选地后跟一个逗号,然后是 conj_patt
的匹配,然后再匹配一个noun_patt
匹配”。对于正则表达式来说足够简单:
patt = r'({0},? )+{1} {0}'.format(noun_patt, conj_patt)
您并不是真的想使用 re.findall()
,而是使用 re.search()
,因为您只希望每行匹配一个:
for line in lines:
... print re.search(patt, line).group(0)
...
bacon, cheese and eggs
milk, cheese, and bacon
milk, cheese or eggs
milk, bacon, or eggs
请注意,就解析英语而言,您已经接近(如果不是遇到)正则表达式的限制。任何比这更复杂的东西,您将想要研究实际的解析,也许使用 NLTK。
关于python - 从多个列表中的多个元素查找文本文件中的模式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18939934/
我想做的是让 JTextPane 在 JPanel 中占用尽可能多的空间。对于我使用的 UpdateInfoPanel: public class UpdateInfoPanel extends JP
我在 JPanel 中有一个 JTextArea,我想将其与 JScrollPane 一起使用。我正在使用 GridBagLayout。当我运行它时,框架似乎为 JScrollPane 腾出了空间,但
我想在 xcode 中实现以下功能。 我有一个 View Controller 。在这个 UIViewController 中,我有一个 UITabBar。它们下面是一个 UIView。将 UITab
有谁知道Firebird 2.5有没有类似于SQL中“STUFF”函数的功能? 我有一个包含父用户记录的表,另一个表包含与父相关的子用户记录。我希望能够提取用户拥有的“ROLES”的逗号分隔字符串,而
我想使用 JSON 作为 mirth channel 的输入和输出,例如详细信息保存在数据库中或创建 HL7 消息。 简而言之,输入为 JSON 解析它并输出为任何格式。 最佳答案 var objec
通常我会使用 R 并执行 merge.by,但这个文件似乎太大了,部门中的任何一台计算机都无法处理它! (任何从事遗传学工作的人的附加信息)本质上,插补似乎删除了 snp ID 的 rs 数字,我只剩
我有一个以前可能被问过的问题,但我很难找到正确的描述。我希望有人能帮助我。 在下面的代码中,我设置了varprice,我想添加javascript变量accu_id以通过rails在我的数据库中查找记
我有一个简单的 SVG 文件,在 Firefox 中可以正常查看 - 它的一些包装文本使用 foreignObject 包含一些 HTML - 文本包装在 div 中:
所以我正在为学校编写一个 Ruby 程序,如果某个值是 1 或 3,则将 bool 值更改为 true,如果是 0 或 2,则更改为 false。由于我有 Java 背景,所以我认为这段代码应该有效:
我做了什么: 我在这些账户之间创建了 VPC 对等连接 互联网网关也连接到每个 VPC 还配置了路由表(以允许来自双方的流量) 情况1: 当这两个 VPC 在同一个账户中时,我成功测试了从另一个 La
我有一个名为 contacts 的表: user_id contact_id 10294 10295 10294 10293 10293 10294 102
我正在使用 Magento 中的新模板。为避免重复代码,我想为每个产品预览使用相同的子模板。 特别是我做了这样一个展示: $products = Mage::getModel('catalog/pro
“for”是否总是检查协议(protocol)中定义的每个函数中第一个参数的类型? 编辑(改写): 当协议(protocol)方法只有一个参数时,根据该单个参数的类型(直接或任意)找到实现。当协议(p
我想从我的 PHP 代码中调用 JavaScript 函数。我通过使用以下方法实现了这一点: echo ' drawChart($id); '; 这工作正常,但我想从我的 PHP 代码中获取数据,我使
这个问题已经有答案了: Event binding on dynamically created elements? (23 个回答) 已关闭 5 年前。 我有一个动态表单,我想在其中附加一些其他 h
我正在尝试找到一种解决方案,以在 componentDidMount 中的映射项上使用 setState。 我正在使用 GraphQL连同 Gatsby返回许多 data 项目,但要求在特定的 pat
我在 ScrollView 中有一个 View 。只要用户按住该 View ,我想每 80 毫秒调用一次方法。这是我已经实现的: final Runnable vibrate = new Runnab
我用 jni 开发了一个 android 应用程序。我在 GetStringUTFChars 的 dvmDecodeIndirectRef 中得到了一个 dvmabort。我只中止了一次。 为什么会这
当我到达我的 Activity 时,我调用 FragmentPagerAdapter 来处理我的不同选项卡。在我的一个选项卡中,我想显示一个 RecyclerView,但他从未出现过,有了断点,我看到
当我按下 Activity 中的按钮时,会弹出一个 DialogFragment。在对话框 fragment 中,有一个看起来像普通 ListView 的 RecyclerView。 我想要的行为是当
我是一名优秀的程序员,十分优秀!