- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
众所周知,在 Windows 中,当您尝试打开其中一个文件时,包含太多文件的目录会产生糟糕的性能。我有一个程序只能在 Linux 中执行(目前它在 Debian-Lenny 上,但我不想具体说明这个发行版)并将许多文件写入同一目录(有点像存储库)。我所说的“很多”是指每天几十个,这意味着一年后我预计会有大约 5000-10000 个文件。它们应该被保留(一旦文件被创建,它就永远不会被删除)并且假定硬盘具有所需的容量(如果没有,则应该升级)。这些文件的大小范围很广,从几 KB 到几十 MB(但不多于此)。名称始终是数值,增量生成。我担心长期性能下降,所以我会问:
最佳答案
这在很大程度上取决于文件系统。
ext2 和 ext3 的硬限制是每个目录 32,000 个文件。这比你问的要多一些,但足够接近,我不会冒险。此外,每次您按名称访问目录中的文件时,ext2 和 ext3 都会执行线性扫描。
ext4 应该可以解决这些问题,但我个人不能保证。
XFS 从一开始就是为这类事情设计的,即使您将数百万个文件放在目录中,它也能正常工作。
因此,如果您真的需要大量文件,我会使用 XFS 或 ext4。
请注意,如果您有大量文件(除非您使用“ls -f”),没有文件系统可以使“ls”运行得很快,因为“ls”将读取整个目录并对名称进行排序。几万可能不是什么大问题,但一个好的设计应该超出你第一眼认为你需要的规模......
对于您描述的应用程序,我可能会改为创建一个层次结构,因为对于查看它的人来说几乎不需要任何额外的编码或脑力劳动。具体来说,您可以将第一个文件命名为“00/00/01”而不是“000001”。
关于linux - 在同一个 Linux 目录中有数百或数千个文件是否可以(性能方面)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8735875/
我对构面有疑问,并根据构面进行了一些过滤。 我知道这是一个重复的问题,但我找不到答案。 我想知道如何在 flex 搜索中实现相同的功能。 假设我有一个有关汽车和某些方面的索引-例如模型和 颜色。 颜色
我正在尝试找到一种解决方案来为某些方面创建子方面列表。 我有一些产品的衣服尺码,它们存储在 solr 中 "Size_both":"W30L30","尺寸宽度":"W30","Size_length"
我正在尝试找到一种解决方案来为某些方面创建子方面列表。 我有一些产品的衣服尺码,它们存储在 solr 中 "Size_both":"W30L30","尺寸宽度":"W30","Size_length"
我对方面有疑问。他们不开火。我有小方面: @Aspect @Component public class SynchronizingAspect { @Pointcut("execution(
这是在 ruby 中启用散列自动生成的巧妙技巧(取自 facets): # File lib/core/facets/hash/autonew.rb, line 19 def self.a
这个问题在这里已经有了答案: 8年前关闭。 Possible Duplicate: Creating a facet_wrap plot with ggplot2 with different ann
XMLHttpRequest 能否从 http://mydomain.example/ 向 http://mydomain.example:81/ 发送请求? 最佳答案 要使两个文档被视为具有相同的来
我对 Elasticsearch 中的方面有一点问题。 我有一个表格视频,一个表格 channel ,一个 channel 有很多视频。 我只想在 X 个最新视频上显示每个 channel 的 %vi
假设我正在为 4 个人绘制数据图表:Alice、Bob、Chuck 和 Dana。我正在使用 ggplot2 制作一个多面图,每个人一个方面。我的磁盘上还有 4 张图像:Alice.png、Bob.p
我已经下载了收件箱,并且正在使用Pig和Hadoop处理电子邮件。我已经使用Pig和Wonderdog在ElasticSearch中为这些电子邮件编制了索引。 现在,我为收件箱中的每个电子邮件地址创建
我有一个模块如下: define([...], function(...){ function anothermethod() {...} function request() {....}
(defprotocol IAnimal "IAnimal" (report [o] (println (type o) " reporting.\n") (inner-repor
我有一个 Bean 需要向 InfluxDB 报告。数据库在表 INFLUX_DB_SERVER 中注册了 InfluxDB。如果你看一下代码,你会发现方法reportMemory做了很多工作,它构造
我的问题与分面有关。在下面的示例代码中,我查看了一些分面散点图,然后尝试在每个分面的基础上叠加信息(在本例中为平均线)。 tl;dr 版本是我的尝试失败了。要么我添加的平均线计算所有数据(不尊重方面变
假设我正在为 4 个人绘制数据图表:Alice、Bob、Chuck 和 Dana。我正在使用 ggplot2 制作一个多面图,每个人一个方面。我的磁盘上还有 4 张图像:Alice.png、Bob.p
尝试用两个方面包装服务类来获取此调用链: javanica..HystrixCommandAspect -> MyCustomAroundAspect -> MyService 遇到两个问题: Hys
我是 AspectJ 的初学者。我用它在我的网络驱动程序中截取屏幕截图。以下是我的包结构。 我想知道如何在 Browser 类中运行我的程序,以便它使用 Screenshots 类中定义的 Aspec
我在使用 spring aop 时遇到问题 (编辑:如果我的方法不是静态的,则代码可以正常工作) 我的包中有这个结构: aaa.bbb.ccc.Clase1.java aaa.bbb.ddd.Clas
我有一个通用存储库类,其中包含各种标记有 PostSharp 方面 (SecuredOperation) 的方法... public class Repository : IRepository, I
我有一个运行多线程的 Hibernate 事务方法“doImportImpl”。而某些记录需要依次导入,所以代码结构大致是这样的: public RecordResult doImportImpl(S
我是一名优秀的程序员,十分优秀!