gpt4 book ai didi

python - 检查字符串的特定格式的子字符串,如何..?

转载 作者:太空宇宙 更新时间:2023-11-04 11:22:13 25 4
gpt4 key购买 nike

两个字符串。我的元素名称:

Parfume name EDT 50ml

和竞争对手的项目名称:

Parfume another name EDP 60ml

我在一列中列出了一长串这些名称,在另一列中列出了竞争对手的名称,我只想在数据框中保留那些行,无论其他什么,我和竞争对手的名称中都具有相同数量的 ml在这些字符串中看起来像。那么如何在更大的字符串中找到以“ml”结尾的子字符串呢?我可以简单地做

competitors_name 中的“**ml”

看看它们是否含有相同数量的 ml。

谢谢

更新

'ml' 并不总是在字符串的末尾。它可能看起来像这样

Parfume yet another great name 60ml EDP

最佳答案

试试这个:

import re

def same_measurement(my_item, competitor_item, unit="ml"):
matcher = re.compile(r".*?(\d+){}".format(unit))
my_match = matcher.match(my_item)
competitor_match = matcher.match(competitor_item)
return my_match and competitor_match and my_match.group(1) == competitor_match.group(1)

my_item = "Parfume name EDT 50ml"
competitor_item = "Parfume another name EDP 50ml"
assert same_measurement(my_item, competitor_item)

my_item = "Parfume name EDT 50ml"
competitor_item = "Parfume another name EDP 60ml"
assert not same_measurement(my_item, competitor_item)

关于python - 检查字符串的特定格式的子字符串,如何..?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55743840/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com