python - 字节到人类可读，然后返回。无数据丢失-6ren

python - 字节到人类可读，然后返回。无数据丢失

转载作者：IT王子更新时间：2023-10-28 23:34:16

25

4

我需要将包含内存使用情况的字符串(例如:1048576(即 1M))转换为人类可读的版本，反之亦然。

注意:我已经看过这里了: Reusable library to get human readable version of file size?

在这里(即使它不是 python): How to convert human readable memory size into bytes?

到目前为止没有任何帮助，所以我在别处寻找。

我在这里找到了可以为我做这件事的东西:http://code.google.com/p/pyftpdlib/source/browse/trunk/test/bench.py?spec=svn984&r=984#137或者，对于较短的 URL:http://goo.gl/zeJZl

代码:

def bytes2human(n, format="%(value)i%(symbol)s"):
    """
    >>> bytes2human(10000)
    '9K'
    >>> bytes2human(100001221)
    '95M'
    """
    symbols = ('B', 'K', 'M', 'G', 'T', 'P', 'E', 'Z', 'Y')
    prefix = {}
    for i, s in enumerate(symbols[1:]):
        prefix[s] = 1 << (i+1)*10
    for symbol in reversed(symbols[1:]):
        if n >= prefix[symbol]:
            value = float(n) / prefix[symbol]
            return format % locals()
    return format % dict(symbol=symbols[0], value=n)

还有一个以其他方式进行转换的功能(同一站点):

def human2bytes(s):
    """
    >>> human2bytes('1M')
    1048576
    >>> human2bytes('1G')
    1073741824
    """
    symbols = ('B', 'K', 'M', 'G', 'T', 'P', 'E', 'Z', 'Y')
    letter = s[-1:].strip().upper()
    num = s[:-1]
    assert num.isdigit() and letter in symbols
    num = float(num)
    prefix = {symbols[0]:1}
    for i, s in enumerate(symbols[1:]):
        prefix[s] = 1 << (i+1)*10
    return int(num * prefix[letter])

这很好，但它有一些信息丢失，例如:

>>> bytes2human(10000)
'9K'
>>> human2bytes('9K')
9216

为了解决这个问题，我更改了函数 bytes2human

的格式

转入:format="%(value).3f%(symbol)s")

哪个更好，给我这些结果:

>>> bytes2human(10000)
'9.766K'

但是当我尝试使用 human2bytes 函数将它们转换回来时:

>>> human2bytes('9.766K')

Traceback (most recent call last):
  File "<pyshell#366>", line 1, in <module>
    human2bytes('9.766K')
  File "<pyshell#359>", line 12, in human2bytes
    assert num.isdigit() and letter in symbols
AssertionError

这是因为 .

所以我的问题是，如何将人类可读的版本转换回字节版本，而不会丢失数据？

注意:我知道小数点后 3 位也是一点点数据丢失。但就这个问题而言，让我们暂时忽略这一点，我总是可以将其更改为更大的内容。

最佳答案

事实证明，答案比我想象的要简单得多——我提供的链接之一实际上指向了更详细的 function 版本。 :

它能够处理我给它的任何范围。

但感谢您的帮助:

这里复制的代码供后人使用:

## {{{ http://code.activestate.com/recipes/578019/ (r15)
#!/usr/bin/env python

"""
Bytes-to-human / human-to-bytes converter.
Based on: http://goo.gl/kTQMs
Working with Python 2.x and 3.x.

Author: Giampaolo Rodola' <g.rodola [AT] gmail [DOT] com>
License: MIT
"""

# see: http://goo.gl/kTQMs
SYMBOLS = {
    'customary'     : ('B', 'K', 'M', 'G', 'T', 'P', 'E', 'Z', 'Y'),
    'customary_ext' : ('byte', 'kilo', 'mega', 'giga', 'tera', 'peta', 'exa',
                       'zetta', 'iotta'),
    'iec'           : ('Bi', 'Ki', 'Mi', 'Gi', 'Ti', 'Pi', 'Ei', 'Zi', 'Yi'),
    'iec_ext'       : ('byte', 'kibi', 'mebi', 'gibi', 'tebi', 'pebi', 'exbi',
                       'zebi', 'yobi'),
}

def bytes2human(n, format='%(value).1f %(symbol)s', symbols='customary'):
    """
    Convert n bytes into a human readable string based on format.
    symbols can be either "customary", "customary_ext", "iec" or "iec_ext",
    see: http://goo.gl/kTQMs

      >>> bytes2human(0)
      '0.0 B'
      >>> bytes2human(0.9)
      '0.0 B'
      >>> bytes2human(1)
      '1.0 B'
      >>> bytes2human(1.9)
      '1.0 B'
      >>> bytes2human(1024)
      '1.0 K'
      >>> bytes2human(1048576)
      '1.0 M'
      >>> bytes2human(1099511627776127398123789121)
      '909.5 Y'

      >>> bytes2human(9856, symbols="customary")
      '9.6 K'
      >>> bytes2human(9856, symbols="customary_ext")
      '9.6 kilo'
      >>> bytes2human(9856, symbols="iec")
      '9.6 Ki'
      >>> bytes2human(9856, symbols="iec_ext")
      '9.6 kibi'

      >>> bytes2human(10000, "%(value).1f %(symbol)s/sec")
      '9.8 K/sec'

      >>> # precision can be adjusted by playing with %f operator
      >>> bytes2human(10000, format="%(value).5f %(symbol)s")
      '9.76562 K'
    """
    n = int(n)
    if n < 0:
        raise ValueError("n < 0")
    symbols = SYMBOLS[symbols]
    prefix = {}
    for i, s in enumerate(symbols[1:]):
        prefix[s] = 1 << (i+1)*10
    for symbol in reversed(symbols[1:]):
        if n >= prefix[symbol]:
            value = float(n) / prefix[symbol]
            return format % locals()
    return format % dict(symbol=symbols[0], value=n)

def human2bytes(s):
    """
    Attempts to guess the string format based on default symbols
    set and return the corresponding bytes as an integer.
    When unable to recognize the format ValueError is raised.

      >>> human2bytes('0 B')
      0
      >>> human2bytes('1 K')
      1024
      >>> human2bytes('1 M')
      1048576
      >>> human2bytes('1 Gi')
      1073741824
      >>> human2bytes('1 tera')
      1099511627776

      >>> human2bytes('0.5kilo')
      512
      >>> human2bytes('0.1  byte')
      0
      >>> human2bytes('1 k')  # k is an alias for K
      1024
      >>> human2bytes('12 foo')
      Traceback (most recent call last):
          ...
      ValueError: can't interpret '12 foo'
    """
    init = s
    num = ""
    while s and s[0:1].isdigit() or s[0:1] == '.':
        num += s[0]
        s = s[1:]
    num = float(num)
    letter = s.strip()
    for name, sset in SYMBOLS.items():
        if letter in sset:
            break
    else:
        if letter == 'k':
            # treat 'k' as an alias for 'K' as per: http://goo.gl/kTQMs
            sset = SYMBOLS['customary']
            letter = letter.upper()
        else:
            raise ValueError("can't interpret %r" % init)
    prefix = {sset[0]:1}
    for i, s in enumerate(sset[1:]):
        prefix[s] = 1 << (i+1)*10
    return int(num * prefix[letter])


if __name__ == "__main__":
    import doctest
    doctest.testmod()
## end of http://code.activestate.com/recipes/578019/ }}}

关于python - 字节到人类可读，然后返回。无数据丢失，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13343700/

25

4

0

文章推荐： iphone - UIWebView 没有使用 ARC 释放所有事件字节

文章推荐： android - 为什么我应该使用 android 服务而不是 java 线程

文章推荐：代码中的Android ImageView setImageResource

文章推荐： memory - CUDA 常量内存分配是如何工作的？

eclipse - Ubuntu 崩溃，Eclipse 丢失 .metadata，Java Perspective 消失，丢失，丢失
我在 Ubuntu 10.04 LTS 上运行 Eclipse Galileo。今天 Ubuntu 在我身上崩溃了，重新启动后，我发现 Eclipse 已经完全失去了 Java Perspective
模拟过程中 session 丢失
我使用配置了 sonata_user 的 SonataAdminBundle在 config.yml : sonata_user: impersonating: route:
docker exec 丢失
我有 ubuntu 14.04 但它不见了 docker exec sudo docker exec -it ubuntu_bash bash 我希望在现有正在运行的 docker 容器中运行交互式
ubuntu - libstdc++.a 丢失
我正在使用 Ubuntu 8.04/32 位(作为虚拟机)。在一个不是 min 的项目上执行一些 make 时，我得到了错误: g++:/usr/lib/libstdc++.a: 没有这样的文件或目录
ubuntu - ttyACM0 丢失
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问题，使其成为
iphone - UIImagePickerControllerReferenceURL 丢失
我正在尝试获取有关我在 UIImagePicker 中选择的视频的一些数据。因此，当它进入 UIImagePicker 委托(delegate)方法(如下)时，我知道我需要使用信息字典中的 UIIm
drupal - 重新安装后处理程序损坏/丢失
我的网站最近被可能的黑客行为删除了。我上传了备份的文件夹和数据库，但现在我的 View 没有显示。其他一切都有效。我想不出有什么变化，只是上传了几天前的备份。这些字段在 admin/build/vi
Php session 丢失
我执行以下操作来设置我的 session ，这是有效的，因为 echo 出现了。但是当我转到下一页或另一页时， session 不存在吗？我做错了什么？ $session_start(); if ($
sql - _TABLE_SUFFIX 丢失？
我试图在 BigQuery 中使用这段代码，显然是从 GA 中获取数据，但 _TABLE_SUFFIX 似乎有问题。错误显示“错误:无法识别的名称:_TABLE_SUFFIX at [12:3]”您能
c - 数组的输入未扫描/丢失
输入:8(2 5 6 9 10 2 7 4)预期输出:(2 7 9 9 12 5 7 6)实际输出:(2 7 9 9) 这是我的大学作业，也是我第一次在这里提问。我不知道为什么，但 10 没有扫描，有
javascript - $ 函数不工作(丢失？)
$('div'); // 我在上面的代码中遇到错误。在检查 .js 代码时，我找不到名为 $ 的函数，但根据文档，应该有一个。最佳答案试试 http://ajax.googleapis.co
java System.out 丢失
以下简单代码的输出对我来说有点奇怪。它错过了在控制台上打印的 0 到 100 之间的一些数字。谁能解释一下为什么省略打印？我对并发编程完全陌生。 import java.util.concurren
android - 应用程序图标不可见/丢失
我正在学习 xamarin 以构建移动应用程序，但我对 Xamarin 和移动应用程序一无所知。我打开了一个空白的移动应用程序，其中有“Hello world”示例并编辑了一些文本，但我的应用程序图标
ios - double 丢失
我正在将一些值存储到 sqlite 数据库中。因此，数据是作为字符串从文本字段收集的，然后转换为 double 并持久化。这是我试过的 NSDecimalNumber 答案； value.answe
php - mysql中的许多记录突然消失/丢失
我有一个奇怪的案例。突然，其中一个表中的一些记录(这么多记录)丢失了。首先，我认为这是由我的 PHP 脚本中的错误引起的。但是，我检查了一下，我的脚本中没有DELETE操作，只有UPDATE。有谁知道
iphone - 丢失 NSString
我正在复制 NSString来自 NSDictionary进入本地NSString使用 [[NSString alloc] initWithString:] ，对其进行处理(删除一些字符)，然后将其发
将文件移动到一个文件夹深处时 css 丢失
当保存在根文件夹中时，我的非常基本的 html 页面保持样式。为一个组创建了一个新文件夹，但是当我将页面移动到该文件夹时，它们似乎失去了与 css 文件的连接。认为问题可能出在链接上，因为它现在
opencv - `opencv_createsamples` 丢失
我需要使用 OpenCV 训练一些图像。但问题是，我找不到 opencv_createsamples 程序。我以正常方式安装了 OpenCV，因为我使用的是 Windows 7。这个 opencv_c
java - TableCellRenderer 丢失
我有一个绑定(bind)到 JTable 的 ArrayList。之后 bindingGroup.unbind(); bindingGroup.bind(); (完成刷新数据)我丢失了表格单元格渲
Android 丢失 keystore
所以基本上我们只是丢失了一个 keystore 和备份 keystore 。但是我们可能知道原始 keystore 的密码。我的问题是，如果我们知道原始 keystore 的密码，我们可以重新生成

首页

博学

6Ren·AI

商城

python - 字节到人类可读，然后返回。无数据丢失