python - 如何返回最大尺寸的图像-6ren

python - 如何返回最大尺寸的图像

转载作者：行者123 更新时间：2023-12-02 16:58:49

24

4

我已经能够过滤出页面中的所有图片网址，并一个接一个地显示它们

import requests
from bs4 import BeautifulSoup


article_URL = "https://medium.com/bhavaniravi/build-your-1st-python-web-app-with-flask-b039d11f101c"
response = requests.get(article_URL)
soup = bs4.BeautifulSoup(response.text,'html.parser')
images = soup.find('body').find_all('img')
i = 0
image_url = []
for im in images:
    print(im)
    i+=1
    url = im.get('src')
    image_url.append(url)
    print('Downloading: ', url) 
    try:
        response = requests.get(url, stream=True)
        with open(str(i) + '.jpg', 'wb') as out_file:
            shutil.copyfileobj(response.raw, out_file)
            del response
    except:
        print('Could not download: ', url)

new = [x for x in image_url if x is not None]
for url in new:
    resp = requests.get(url, stream=True).raw
    image = np.asarray(bytearray(resp.read()), dtype="uint8")
    image = cv2.imdecode(image, cv2.IMREAD_COLOR)
#     height, width, channels = image.shape
    height, width, _ = image.shape
    dimension = []
    for items in height, width:
        dimension.append(items)
#     print(height, width)
    print(dimension)

我想从URL列表中打印最大尺寸的图像
这是我从列表中得到的结果，这还不够好

[72, 72]
[95, 96]
[13, 60]
[227, 973]
[17, 60]
[229, 771]

最佳答案

我看到两个问题。

您可以在循环内创建dimention = []，以便删除先前的值。您必须在循环和内部循环使用之前创建dimention = []

dimension.append( (width, height) )

在循环之后，您可以使用max(dimension)与max width配对

您仅将width, height保留在dimension中，因此您不知道哪个文件具有此尺寸。您应该保留所有信息

dimension.append( (width, height, url, filename) )

我的版本。
我使用字典 data保留所有信息

data.append({
                'url': url,
                'path': filename,
                'width': width,
                'height': height,
            })

然后我在 key中使用 max()来获取最大 width的项目

max(data, key=lambda x:x['width'])

但是我可以使用 x['height']或 x['width'] * x['height']的方式相同

import requests
from bs4 import BeautifulSoup
import shutil
import cv2

article_URL = "https://medium.com/bhavaniravi/build-your-1st-python-web-app-with-flask-b039d11f101c"

response = requests.get(article_URL)
soup = BeautifulSoup(response.text, 'html.parser')
images = soup.find('body').find_all('img')

# --- loop --- 

data = []
i = 0

for img in images:
    print('HTML:', img)
    
    url = img.get('src')

    if url:  # skip `url` with `None`
        print('Downloading:', url) 
        try:
            response = requests.get(url, stream=True)

            i += 1
            url = url.rsplit('?', 1)[0]  # remove ?opt=20 after filename
            ext = url.rsplit('.', 1)[-1] # .png, .jpg, .jpeg
            filename = f'{i}.{ext}' 
            print('Filename:', filename)

            with open(filename, 'wb') as out_file:
                shutil.copyfileobj(response.raw, out_file)

            image = cv2.imread(filename)
            height, width = image.shape[:2]

            data.append({
                'url': url,
                'path': filename,
                'width': width,
                'height': height,
            })

        except Exception as ex:
            print('Could not download: ', url)
            print('Exception:', ex)

    print('---')

# --- after loop ---

print('max:', max(data, key=lambda x:x['width']))

all_sorted = sorted(data, key=lambda x:x['width'], reverse=True)

print('Top 3:', all_sorted[:3])
# or
for item in all_sorted[:3]:
    print(item['width'], item['url'])

BTW:仅使用 src获取图像

 .find_all('img', {'src': True})

关于python - 如何返回最大尺寸的图像，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63345648/

24

4

0

文章推荐： c++ - 尽管随机初始化，但K均值聚类中心每次运行都相同

文章推荐： python - Python OpenCV : Mutithreading with opecv video streaming

文章推荐： python - 如何检查像素是否为空？

c - 为什么这个 malloc 包装器对请求的内存大小执行此操作？尺寸 = (尺寸 + 3) & ~3;
我正在查看 DOOM 源代码，我找到了 this行。 void * Z_Malloc (int size, int tag, void *user)
window 尺寸
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 9 年前。 Improve t
c++ - 如何获得特征矩阵的形状(尺寸)？
我正从 Python 和 Numpy 转向 C++ 和 Eigen。在 Python 中，我可以使用 .shape 属性获取 Numpy 数组/矩阵的形状(维度)，如下所示: import nump
youtube - 嵌入YouTube:尺寸
固定嵌入式YouTube视频的宽度并自己照顾自己的高度是否安全？我有一个应用程序，用户可以将通知发布到公告板上。这些通知主要是文本(带有有限的html标签)和嵌入式图像。我现在要添加对嵌入式YouT
javascript - 创建后如何更改盒子的尺寸/尺寸？
可以轻松创建一个 THREE.BoxGeometry，在创建宽度、高度和深度的三个独立参数时，您必须在其中传递参数。我想创建任何和所有不带参数的THREE[types]()，并在之后设置值。有没有
JavaScript Canvas 尺寸
我在 HTML 页面上有一个 Canvas : 属性width和height将 Canvas 拉伸(stretch)到某个字段，但不调整其大小。所以 var canvasElement = docu
CSS 定位/尺寸
我在我的 css 中使用 @media all 和 (max-width: 600px) {} 作为响应式菜单，问题是它没有正确显示。我想让橙色填充绿色空间……当然，还要将绿色空间变成透明的。基本上
c++ - 尺寸、长度换算？
(我知道我问了很多关于这个的问题!) 基本上，我正在尝试将一些代码从 Matlab 转换为 C++，我遇到了这个: n = sum(size(blocks)) - len; 现在我计算了 vector
javascript - 选择类别然后显示类别.尺寸
您好，我有一个用于创建产品的表单。用户应该能够选择类别(例如 T 恤)，然后 T 恤的所有尺码(例如 S、M、L)都会下拉。用户可以输入每种尺寸的数量。 Javascript 对此不起作用。用户可以选
html - 尺寸、对齐方式和列表样式等社交图标命令对页脚没有任何影响
我正在尝试在页脚中定位和调整我的社交图标链接的大小，但是，这些命令似乎都没有效果，尤其是当我尝试调整它们的大小时。我试过将宽度和高度标记为“!重要”，但这也没有效果。这是代码的 JSFiddle:h
canvas - 给定特定尺寸的最大潜在 PNG 尺寸
我目前正在创建一个 HTML5 canvas基于绘图程序。用户可以绘制一张图像或几张图像“页面”，并将其保存到云端以供日后快速检索。这是用于交互式白板的；老师不能总是确定他们计划类(class)使用的
image - 如何为网页保存图像？ (格式/尺寸)
为网站存储图像的最佳方式是什么？我不应该超过什么尺寸？现在，我将所有界面文件保存在 png(主要是 Sprite )中，并将常用图像保存在 jpg 中。一些图像大约为 100-150Kb。保存图
jquery - fancybox iframe 尺寸
在 fancybox 主页 ( http://fancybox.net/home ) 中，有一个打开尺寸为屏幕 75% 的 iFrame 的示例。我无法按照网站上的说明通过修改 .js 文件的宽度和
iPhone 4 Nib 尺寸
我想做一个仅适用于 iPhone 4 的应用程序，该应用程序使用 iAd AdBannerView。当我添加它时，它的固定大小为 320x50。在更高分辨率下这如何工作？有人可以解释一下 iPhon
cocoa - 旋转的 NSString 尺寸
我们有一个 NSString，我们使用 - (NSSize)sizeWithAttributes:(NSDictionary *)attributes 来测量边界框。一切都好。现在我们使用标准 NS
delphi - 如何仅通过知道其句柄来确定 Canvas 尺寸？
我想知道 Canvas 的宽度和高度，但我只知道它的 HDC。我尝试过这段代码: procedure TForm92.Button1Click(Sender: TObject); var hBi
javascript - 旋转路径后计算 SVG 尺寸
问题是如何使用数学从 START SVG 维度(不带旋转)和 END SVG 维度(带旋转)获取 >开始 SVG 信息。基本上，要从 START SVG 到 END SVG，我需要执行 -115.60
oracle - 鱿鱼进口 Parquet 尺寸
我的问题是，我有一个包含50万行的Oracle表。我设置了sqoop以将其作为 Parquet 文件导入到HDFS。我将--num-partition参数设置为32，得到了32个 Parquet 文件
wordpress - YouTube 尺寸 WordPress
是否可以更改 WordPress 中当前主题的 YouTube(或其他视频)的默认嵌入尺寸？我搜索了一个插件和一些代码，但似乎找不到。我的意思是当您将 YouTube 网址粘贴到帖子或页面中时使用的
JavaFX 缩小 ImageView 尺寸
我有一个组，其中包含一个矩形和顶部的图像。我希望矩形可以调整大小，并且图像应该具有固定大小，除非矩形小于图像的情况。然后图像应该随着矩形缩小。图像还应该始终居中并有一些填充。除了图像的缩小尺寸部分

首页

博学

6Ren·AI

商城

python - 如何返回最大尺寸的图像