gpt4 book ai didi

python - Python/django 中的 URL 获取 : prevent abuse, mailcious urls 等

转载 作者:行者123 更新时间:2023-11-28 17:49:32 27 4
gpt4 key购买 nike

我正在构建一个网页,其特色非常类似于 facebook 墙/新闻源。注册用户(或通过 Facebook-connect、google auth)可以提交 url。目前,我正在获取这些 URL 并使用 urllib2 来获取 URL 的内容并搜索相关信息,例如 og:properties、HTML title-tag 和 perheps some -tags for images。

现在,我明白当我让用户向我的服务器提供要打开的 URL 时,我会让我的服务器面临风险。

我的问题是风险有多高?我可以进行哪些标准安全检查?

至于现在,我只是在没有任何“主动”保护的情况下打开 url,因为我不知道要检查什么。

以及如何将获取的内容存储到数据库中。 Django 是否内置了针对 SQL 注入(inject)的保护?

谢谢!

最佳答案

其中一个明显的风险是有人可能会将您的网站用作传播恶意 URL 的载体。

例如假设我发现了一个格式错误的 html,它允许在基于 webkit 的浏览器中执行任意代码,比如利用某个 0-day 缓冲区溢出。假设您的网站很受欢迎,那将是我肯定会尝试的网站之一。

现在,您不可能匹配提交的 URL 的内容来查找安全漏洞。那时您将成为一家反病毒/安全公司。 Chrome 和 Safari 都在一定程度上解决了这些问题。

为了用户/内容的缘故以及我解释的风险,您可以构建一个通过用户操作学习的标记系统。您可以在有人标记 URL 时训练分类器,请参阅 examples在这里。

我敢肯定有很多这样的解决方案,在 python 中也是如此。

要快速了解安全性,Django 上下文中的 sql 注入(inject),checkout this link .

关于python - Python/django 中的 URL 获取 : prevent abuse, mailcious urls 等,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12815448/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com