python - 将任意长度列表映射到固定长度，保留内部结果的频率和位置(尽可能多)-6ren

python - 将任意长度列表映射到固定长度，保留内部结果的频率和位置(尽可能多)

转载作者：塔克拉玛干更新时间：2023-11-03 03:55:14

24

4

背景故事:

将数据汇集在一起以输入神经网络；作为文档(长字符串)开始；被分成句子，句子减少到 1 或 0，这取决于它们是否具有特征(在本例中为词类)。

问题是文档有不同数量的句子，所以句子和输入神经元之间不可能是 1-1；你必须训练固定数量的神经元(除非我遗漏了什么)。

所以，我正在研究一种算法，将数组映射到固定大小，同时尽可能多地保留数组中那些 1 的频率和位置(因为这是 NN 做出决定的依据。

代码:

假设我们的目标是固定长度的 10 个句子或神经元，并且需要能够处理更小和更大的数组。

new_length = 10
short = [1,0,1,0,0,0,0,1]
long  = [1,1,0,0,1,0,0,0,0,1,0,0,1]

def map_to_fixed_length(arr, new_length):
    arr_length = len(arr)
    partition_size = arr_length/new_length
    res = []
    for i in range(new_length):
        slice_start_index = int(math.floor(i * partition_size))
        slice_end_index = int(math.ceil(i * partition_size))
        partition = arr[slice_start_index:slice_end_index]
        val = sum(partition)
        res.append([slice_start_index, slice_end_index, partition])
        if val > 0:
            res.append(1)
        else:
            res.append(0)
    return res

可能不是很pythonic。无论如何，问题在于这是忽略了某些索引切片。例如，short 的最后一个索引被省略，并且由于四舍五入，各种索引也被省略。

这是我一直在做的工作的简化版本，主要是添加 if 语句来解决这留下的所有空白。但是有更好的方法吗？统计上更合理一点？

我正在查看 numpy，但所有调整大小的函数都只是用零或相当任意的东西填充。

最佳答案

一个简单的方法可能是像这样使用 scipy.interpolate.interp1d:

>>> from scipy.interpolate import interp1d

>>> def resample(data, n):
...     m = len(data)
...     xin, xout = np.arange(n, 2*m*n, 2*n), np.arange(m, 2*m*n, 2*m)
...     return interp1d(xin, data, 'nearest', fill_value='extrapolate')(xout)
... 
>>> resample(short, new_length)
array([1., 0., 0., 1., 0., 0., 0., 0., 0., 1.])
>>> 
>>> resample(long, new_length)
array([1., 1., 0., 1., 0., 0., 0., 1., 0., 1.])

关于python - 将任意长度列表映射到固定长度，保留内部结果的频率和位置(尽可能多)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50649875/

24

4

0

文章推荐： algorithm - 从一组线中查找封闭(表面)区域

文章推荐： java - 将 Grails 集成到现有的 Spring 应用程序中？

文章推荐： java - 面对 EDT 如何管理游戏状态？

文章推荐： algorithm - 双向链表的分区排序

html - 具有全屏高度的 3 列布局(固定-流体-固定)
我正在尝试实现 3 列固定-流体-固定布局。此外，布局的高度必须占据整个屏幕，使其看起来像从上到下的 3 个实心列。总结: Left-column: fixed-width Center-col
html - 具有最小宽度的 3 列布局(固定、流动、固定)
我在网上搜索过，似乎找不到一个干净、简单、所有浏览器都友好的 3 列布局。我希望有 3 列布局，左列固定为 200px，右列固定为 200px，中间列为剩余宽度，但最小宽度为 600px。所以整体最
css - 如何创建 3 列布局(固定、固定、流动)
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this q
audio - 音频归一化/固定？
我正在使用一些音频指纹技术来标记长录音中的歌曲。例如，在广播节目中的记录。指纹机制工作正常，但我在归一化(或下采样)方面遇到问题。在这里您可以看到两首相同的歌曲，但波形不同。我知道我应该进行一些直流
c++ - 固定，设定精度功能
为什么使用cout调用setprecision和fixed以及其他iomanip函数不像例如name.find('')plz这样的字符串函数最佳答案它们允许您以以下方式链接操作: cout <<
jquery - 固定/跟随侧边栏的问题
我正在尝试创建一个侧边栏，当用户向下滚动页面时，该侧边栏会跟随用户，并且我设法使用以下代码实现了效果: 标记 Javas
macos - 内存是否被锁定(固定)？
我正在尝试设置一些性能分析以及影响缓冲策略的运行时决策。我的应用程序收到一个指向由库(CUDA 或 OpenCL)分配的缓冲区的指针。如何测试内存区域是否被页面锁定？据我所知，POSIX 给了我们
C# - 固定/内联数组
我正在用 C# 编写一个 B+ 树实现，我为我的应用程序选择的树实现有一个非常特定的结构，它是缓存敏感的。为了实现这些属性，它对树节点有严格的布局策略。我想要的只是使用 C# 的 fixed 来表达
Android，在屏幕底部定位一个元素，固定
我试图通过将 fragment 注入(inject)容器来在每个屏幕的底部放置一个广告 View 。通过使用 LinearLayout，我可以将 adview 置于操作栏下方的顶部。我已经尝试了 Re
jquery - 导航 - 固定
我正在尝试创建一个导航稍微复杂的网站。我已经让导航看起来像我想要的初始加载，但现在我试图让它粘性导航到滚动顶部。我已经能够在导航栏到达顶部时创建一个类，但无法使其粘滞。每次我添加一个位置时，它都会跳回
css - 固定、动态高度元素占用空间的解决方案
首先，我正在寻找一个纯 CSS 解决方案。我可以使用 JavaScript 非常轻松地做到这一点，所以不要费心给我提示如何在 JS 中做到这一点。我有一个包含 3 个容器的网页。其中 2 个是固定的
CSS 固定/绝对定位到较早的亲戚？
我猜这里有一种 super 特例。我正在处理许多包含。现在我正在一个包含的内容文件中编码。我需要一个灯箱，它有一个 20% 的黑色背景覆盖整个页面，包括本身固定的标题，并在先前的 PHP 文件中设置
css - 固定/相对定位 :
我正在尝试制作一个包含两个“固定”侧边栏图像和一个“固定”标题图像的页面。由于标题是固定的(距顶部 0 到 10%)。我不希望页眉图像与页面上的任何文本重叠。我尝试将段落标记定位为“相对”，并将其设置
CSS:居中位置:固定
我遇到了一个(水平)居中固定位置元素的解决方案，如下所示: element { width: 200px; position: fixed; left: 0; righ
HTML 正文高度 - 固定？
我试图让我的网站主体具有固定的高度(我想!)。无论如何，站点正文只是白色，边框大小为 1。基本上，正文的大小取决于其中的内容，例如，随着添加更多内容，它会自动调整大小。我想要的是垂直滚动条，这样主
css 布局(固定)
是否可以在 css 中创建 master-detail-states 布局？我需要 3 个占位符: +---------------+-------+ | A | B
同一请求中的 SSL 固定
我的问题是，我是否必须在每个 Get/Post 请求之前单独请求检查 SSL Pinning OkHttpClient client = new OkHttpClient.Builder().cert
algorithm - (固定)平衡树的摊销成本
假设我有一个具有 N 个节点的常量(一旦构建就不会改变)平衡树，每个内部节点都有 p 个子节点。显然，访问节点的最坏情况是 logp(N)。但是访问 r 个节点的摊销成本呢？如果我们按升序访问它们(有
php - 如何防止php项目中的 session 固定？
我知道会话固定是用php破解网站的方法。会话固定是一种允许攻击者劫持有效用户会话的攻击 session fixation 但我不知道这可以防止我的项目中出现此问题。是描述解决方案的方式或样本。最
jQuery Masonry 固定/前置元素
我在 jquery 砖石布局内有一个导航元素，我想将其修复到特定位置，比如右上角。是否可以这样做，以便所有其他元素都位于它周围？诸如前置导航之类的东西.. 这是我的代码:http://jsfiddl

首页

博学

6Ren·AI

商城

python - 将任意长度列表映射到固定长度，保留内部结果的频率和位置(尽可能多)