python - 比较三个文本列表以查看匹配的单词-6ren

python - 比较三个文本列表以查看匹配的单词

转载作者：太空宇宙更新时间：2023-11-03 21:05:33

26

4

您好，我编写了一个函数来读取和比较三个句子列表之间的单词，如果任何单词匹配，则该函数将返回文本，否则False，基本上采用在来自 selenium 的网络元素列表中并检查如果文本与任何关键字列表匹配，我想要做的是修改它，如果1个或3个或更多，则在检查后返回链接，即如果只有两个单词匹配则返回False.(如果任何单词匹配且其中一个关键词匹配链接，此函数将返回链接)我想要这个函数将返回链接，如果(1,3,4,5...)的单词匹配并且其中一个关键词匹配链接(只有0,2返回False)链接和文本长度相等。

from selenium import webdriver
d = webdriver.Chrome(executable_path=r"C:\Users\test\PycharmProjects\chromedriver")
sentence = "hello world from python"
url_keywords = [".com",".edu"]
d.get("https://google.com/search?q={}".format(sentence))
y=d.find_elements_by_xpath("//a[@href]")
a=check(y,url_keywords)
li=[]
if a:
    check(y)
else:
    pass

def check(y,url_keywords):
    links = [i.get('href') for i in y]
    texts = [i.text_content() for i in y]
    for i, link in enumerate(links):
        for keyword in url_keywords:
            if keyword in link:
                for word in sentence.lower().split():
                    if word in texts[i].lower():
                        return link

    return False

如果有更简单的方法，请指教

最佳答案

from selenium import webdriver

# Use descriptive names for variables, not single letters.
driver = webdriver.Chrome(executable_path=r"C:\Users\test\PycharmProjects\chromedriver")

# Use UPPERCASE for constants
SENTENCE = "hello world from python"
URL_KEYWORDS = [".com",".edu"]

driver.get("https://google.com/search?q={}".format(sentence))
elements  = driver.find_elements_by_xpath("//a[@href]")
result = check(elements, url_keywords)


def check(elements, url_keywords):
    links = [i.get('href') for i in elements]
    texts = [i.text_content() for i in elements]

    # Use zip to avoid so much nesting! Also means you can drop the index variable "i"
    search_space = zip(links, texts)

    for link, text in search_space:
        #Let's keep track
        number_of_matches = 0  
        for keyword in url_keywords:
            # Create a separate function, again to avoid so much nesting! (see "Zen of Python")
            match = is_match(keyword, link, text)
            #If match is true int(match) will be 1, otherwise 0
            number_of_matches += int(match)
        if has_correct_number_of_matches(number_of_matches):
            return link
        else:
            return False

def normalise(string):
    """
    There is often quite a bit that we want to do to normalise strings. And you might want to extend this later. For this reason, I again make a new function, and also add in the "strip" method for good measure and as an example of extending the normalisation behaviour.
    """
    return string.lower().strip()

def is_match(keyword, link, text):
    if keyword in link:
        for word in normalise(sentence).split():
            if word in normalise(text):
                return True
        else:
            return False
     else:
        return False

def has_correct_number_of_matches(number_of_matches):
    """Now that this function is isolated, you can define it however you want!
    """
    return number_of_matches not in (0, 2)

关于python - 比较三个文本列表以查看匹配的单词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55433103/

26

4

0

文章推荐： c# - XDocument.Load 方法在 XDocument 中不存在

文章推荐： html - CSS 不会覆盖样式

文章推荐： c# - 如何将dataGridView的前3列readOnly设置为true

文章推荐： html - 在上应用边距

ios - 自定义动画过渡 - 查看/查看
我有一个用 Swift 编写的自定义转换，当呈现的 View 从侧面进入时，被关闭的 View 消失。现在我想要同样的效果，但我希望呈现的 View 从顶部进入，而被取消的 View 从底部出来。
android - DataBindingUtil findBinding(查看 View )与 getBinding(查看 View )
该方法的预期目的是什么 findBinding(View view) ？我一直在使用数据绑定(bind)库测试版。目前还没有针对各个类的官方引用文档，所以我一直在查看源代码以了解我们可以访问哪些方
rust - 查看 `for` 循环内的迭代器
我试图在遍历 &str 时查看当前位置前面的字符。 let myStr = "12345"; let mut iter = myStr.chars().peekable(); for c in ite
azure - 查看/更改Azure函数应用程序的底层存储
每当我在 Azure 中创建新的 Azure 函数应用时，我都会选择一个存储帐户供其使用。创建应用后，如何查看/更改存储帐户？我尝试在门户中浏览，但无法看到可以在哪里配置它。最佳答案创建后，您
qt - 查看 QTextStream
我想查看读取 QFile 的 QTextStream 的下一个字符，以创建一个高效的标记器。但是，我没有找到任何令人满意的解决方案。 QFile f("test.txt"); f.open(QIOD
java - 旋转手机取消选择列表中的项目查看
当我旋转手机时， ListView 中选定的项目将被取消选择。这是我的适配器。我只想更改所选项目的颜色(仅是单个选择)，当我旋转手机时，我想查看我选择的内容。现在，当我旋转手机时，我看不到所选项目。
查看 'puts'返回值，然后呢？
我开始编写代码来检查函数的返回值，但我不确定在捕获到一些错误后如何继续。例如，在 fgets 中: while( fgets( rta, 3, stdin ) == NULL ) {
java - 可滚动弧形轮查看
是否可以获取或创建一个 optional 轮，它以假想的圆圈滚动而不是直接向下(垂直)滚动？直线链接但想要弯曲例如就像控件 here ，但车轮是弯曲的？最佳答案有没有可能你想要的是一个轮播？
查看 Mysql 错误但在正常查询中工作
当我尝试为其创建 View 时出现错误:“ View 的 SELECT 在 FROM 子句中包含一个子查询”，但它在普通查询中工作正常。我认为它与我的 WHERE 子句有关，但我不明白为什么或如何修复
c# - 查看/检索属性
在一个类中，我有以下代码: /// [System.Xml.Serialization.XmlElementAttribute("Errors", typeof(ErrorsType))] [Sys
android - 在屏幕上显示错误信息(查看)
我想显示来自 catch block 的错误(日志)消息。如何在单个屏幕上显示所有消息(堆栈)，以便用户了解？谢谢... 最佳答案使用 Toast 怎么样？示例: Toast.makeText(
ios - 查看 tableView
我有以下屏幕(图像)，当按下按钮时显示一个侧面菜单，菜单出现，另外我有一个 uitableview 来显示其他东西我的问题是，当侧边菜单出现时，uitableview 被调整了大小。如何保持 ui
javascript - 查看 'SeekBar'的render方法
invariant violation element type is invalid: expected a string (for built-in components) or a class/
c - 查看 execvp();
我是新手，正在尝试学习 fork() 和系统调用的功能，现在我正在使用 execvp() 来尝试制作 bash，但我遇到的问题是，当我编写正确的命令时，程序结束，我想循环使用我的 bash，直到有人在
php - 调用字符串上的成员函数 all()(查看 :
我正在尝试使用 Laravel request validation method 创建一个登录页面和凭据验证 -> 如果用户未通过身份验证，它将返回错误“密码错误....” 我在两种不同的情况下看
java - 查看.jar文件的内容
我有一个 .jar 文件，我需要查看 jar 文件的内容。是否有任何解码器可用于解码 jar 文件。我也有 solaris 环境，我需要知道什么是最佳答案使用jar命令行，即 jar tf j
查看 Git 提交中发生了什么变化
Git 提供了几种方式可以帮你快速查看提交中哪些文件被改变。如果你每天使用 Git，应该会提交不少改动。如果你每天和其他人在一个项目中使用 Git，假设每个人每天的提
tensorflow: 查看 tensor详细数值方法
问题 tensor详细数值不能直接print打印： ? 1
查看 MySQL 已经运行多长时间的方法
一，uptime 可以查看系统的运行时间 show global status like 'uptime'; 二，利用linux命令查看 Linux 下有个 uptime 可以查看系统的运行时
10、查看 XML 文件
在所有主流的浏览器中，均能够查看原始的 XML 文件不要指望 XML 文件会直接显示为 HTML 页面查看 XML 文件 <?xml version="1.0" e

首页

博学

6Ren·AI

商城

python - 比较三个文本列表以查看匹配的单词