- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在编写一个简单的 Linux USB 字符驱动程序,允许从它创建的设备节点读取一个短字符串。
它工作正常,但我注意到使用 cat
从设备节点读取和使用 Files.readAllBytes 从 Java 程序读取之间存在差异.
使用 cat
读取,在第一次调用 file_operations.read
函数时传入大小为 131072 的缓冲区和 5 个字节字符串被复制:
kernel: [46863.186331] usbtherm: Device was opened
kernel: [46863.186407] usbtherm: buffer: 131072, read: 5, offset: 5
kernel: [46863.186444] usbtherm: done, returning 0
kernel: [46863.186481] usbtherm: Device was released
用Files.readAllBytes
读取,第一次调用传入一个大小为1的缓冲区,然后传入一个大小为8191的缓冲区,剩下的4个字节被复制:
kernel: [51442.728879] usbtherm: Device was opened
kernel: [51442.729032] usbtherm: buffer: 1, read: 1, offset: 1
kernel: [51442.729102] usbtherm: buffer: 8191, read: 4, offset: 5
kernel: [51442.729140] usbtherm: done, returning 0
kernel: [51442.729158] usbtherm: Device was released
file_operations.read
函数(包括调试 printk
的)是:
static ssize_t device_read(struct file *filp, char *buffer, size_t length,
loff_t *offset)
{
int err = 0;
size_t msg_len = 0;
size_t len_read = 0;
msg_len = strlen(message);
if (*offset >= msg_len)
{
printk(KERN_INFO "usbtherm: done, returning 0\n");
return 0;
}
len_read = msg_len - *offset;
if (len_read > length)
{
len_read = length;
}
err = copy_to_user(buffer, message + *offset, len_read);
if (err)
{
err = -EFAULT;
goto error;
}
*offset += len_read;
printk(KERN_INFO "usbtherm: buffer: %ld, read: %ld, offset: %lld\n",
length, len_read, *offset);
return len_read;
error:
return err;
}
两种情况下读取的字符串是相同的,所以我想没关系,我只是想知道为什么会有不同的行为?
最佳答案
GNU cat
来源 cat
,
insize = io_blksize (stat_buf);
您可以看到缓冲区的大小由 coreutils 的 io_bliksize()
决定,它有一个相当 interesting comment在这方面,
/* As of May 2014, 128KiB is determined to be the minimium blksize to best minimize system call overhead.
所以这将用 cat
解释结果,因为 128KiB 是 131072 字节,GNUrus 认为这是最小化系统调用开销的最佳方式。
Files.readAllBytes
有点难以掌握,至少对于像我这样单纯的人来说是这样。 source of readAllBytes
public static byte[] readAllBytes(Path path) throws IOException {
try (SeekableByteChannel sbc = Files.newByteChannel(path);
InputStream in = Channels.newInputStream(sbc)) {
long size = sbc.size();
if (size > (long)MAX_BUFFER_SIZE)
throw new OutOfMemoryError("Required array size too large");
return read(in, (int)size);
}
}
显示它只是在调用 read(InputStream, initialSize)
其中初始大小由字节 channel 的大小决定。 size()
方法也有一个有趣的评论,
The size of files that are not isRegularFile() files is implementation specific and therefore unspecified.
最后, read(InputStream, initialSize)
电话 InputStream.read(byteArray, offset, length)
进行阅读(源代码中的注释来自原始源代码,并且自 capacity - nread = 0
以来令人困惑,因此第一次到达 while 循环时,它不读取到 EOF):
private static byte[] read(InputStream source, int initialSize)
throws IOException {
int capacity = initialSize;
byte[] buf = new byte[capacity];
int nread = 0;
int n;
for (;;) {
// read to EOF which may read more or less than initialSize (eg: file
// is truncated while we are reading)
while ((n = source.read(buf, nread, capacity - nread)) > 0)
nread += n;
// if last call to source.read() returned -1, we are done
// otherwise, try to read one more byte; if that failed we're done too
if (n < 0 || (n = source.read()) < 0)
break;
// one more byte was read; need to allocate a larger buffer
if (capacity <= MAX_BUFFER_SIZE - capacity) {
capacity = Math.max(capacity << 1, BUFFER_SIZE);
} else {
if (capacity == MAX_BUFFER_SIZE)
throw new OutOfMemoryError("Required array size too large");
capacity = MAX_BUFFER_SIZE;
}
buf = Arrays.copyOf(buf, capacity);
buf[nread++] = (byte)n;
}
return (capacity == nread) ? buf : Arrays.copyOf(buf, nread);
}
BUFFER_SIZE
的声明对于 Files
// buffer size used for reading and writing
private static final int BUFFER_SIZE = 8192;
InputStream.read(byteArray, offset, length)
的文档/来源包含相关评论,
If length is zero, then no bytes are read and 0 is returned;
自 size()
为您的设备节点返回 0 字节,这是 read(InputStream source, int initialSize)
中发生的情况:
在第一轮for (;;)
循环:
capacity=0
和 nread=0
.所以 source.read
在while ((n =
将 0 个字节读入
source.read(buf, nread, capacity - nread)) > 0)buf
并返回 0:while
的条件循环是假的,它所做的就是n = 0
作为条件的副作用。
自 n = 0
, source.read()
在 if (n < 0 || (n = source.read()) < 0) break;
读取 1 个字节,表达式计算为 false
: 我们的 for
循环不退出。这导致您的“缓冲区:1,读取:1,偏移量:1”
capacity
缓冲区的设置为 BUFFER_SIZE
, 读取的单个字节被放入 buf[0]
, 和 nread
递增。
第二轮for (;;)
循环
因此有capacity=8192
和 nread=1
,这使得 while ((n = source.read(buf, nread, capacity - nread)) > 0) nread += n;
从偏移量 1 读取 8191 字节直到 source.read
返回 -1:EOF!这发生在读取剩余的 4 个字节之后。这导致您的“缓冲区:8191,读取:4,偏移量:5”。
从现在开始 n = -1
, if (n < 0 || (n = source.read()) < 0) break;
中的表达式n < 0
上的短路,这使得我们的 for
循环退出而不读取任何更多字节。
最后,该方法返回 Arrays.copyOf(buf, nread)
: 放置读取字节的那部分缓冲区的副本。
关于java - 为什么 Files.readAllBytes 首先读取 bufsize 为 1?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37635183/
我遇到以下问题。我想读取一个包含数百万行和数百列的大型 csv。我想向下转换列的数据类型。我的方法是读取 csv,然后使用 pd.to_numeric() 对其进行向下转换。我不知道列数及其类型。在读
目前,我从 SQL server (2008) 数据库获取数据。 cyurrent的方法是使用DataTable,然后将其传递并使用。 if (parameters != null)
我有以下问题。我有一个巨大的 csv 文件,想用多处理加载它。对于一个包含 500000 行和 130 列不同数据类型的示例文件,Pandas 需要 19 秒。我试过 dask 因为我想多处理阅读。但
是否有关于用于序列化各种 MFC 数据结构的二进制格式的明确文档?我已经能够在十六进制编辑器中查看我自己的一些类,并使用 Java 的 ByteBuffer 类读取它们(使用自动字节顺序转换等)。 但
我正在使用 Selenium 进行测试,我们用 HTML 文件编写测试用例,并用它们制作测试套件,我们的要求是编写足够健壮的测试用例,以根据测试环境改变自身。 为此,我不希望在 HTML 脚本本身中包
我需要一个 JavaScript 代码来读取存储为 .txt 文件的字典(或者也可以保存为任何其他类型的文件。它也可以在线获得)并将其内容存储在一个变量中。我不能找到一种让 JavaScript 像
我正在尝试遍历包含 SSH 登录和其他日志的日志文本文件。 程序正在返回 SSH 登录的总数。 我的解决方案确实有效,但似乎有点慢(在 200mo 文件上大约需要 3.5 秒)。我想知道是否有任何方法
我正在将大量数据从一个电子表格复制到工作簿中的其他 160 个电子表格。目前,Excel (2013) 遇到错误,因为它没有足够的资源来完成操作。 我的目标是将工作表 4 中 V13:XI1150 范
我正在尝试读取一个有 1147 行的文本文件。下面的代码仅读取第 1050-1147 行。我的目标是读取整个文件并提取位于不同行的特定值以在脚本中使用。一个示例是包含“BlockList: 2”的行中
我正在为游戏编写解释器。用户将其移动输入解释器,程序执行该移动。 现在我想为每个决定实现一个时间限制。玩家不应该能够思考超过 30 秒来写一个移动并按下回车。 call_with_time_limit
以this file例如,我正在尝试读取 data.frame 中的数据。来自 the doc (pdf 文件,表 1),它遵循一些 fortran 约定。我尝试了以下但收效甚微: dir 0' 将
我正在使用 R 阅读 Outlook 附件。我的引用在这里:Download attachment from an outlook email using R 这是我的电子邮件的截图: 这每天都会发送
我不会从表格中读取行来将主题放在列表中 php脚本 $url_obj='http://'.$host.':8069/xmlrpc/object'; $sock=new xmlrpc_client($u
我有一个这样的 csv 文件: id,name,value 1,peter,5 2,peter\,paul,3 我如何读取此文件并告诉 R "\," 不表示新列,仅表示 ","。 我必须添加该文件
我正在尝试读取 ~/Library/Preferences/com.apple.mail.plist (在 Snow Leopard 上)以获取电子邮件地址和其他信息以进入“关于”对话框。我使用以下代
This question already has answers here: How do I use floating-point division in bash? (19个回答) 5个月前关闭
本练习的目标是读取输入文件并将其存储到表中,然后验证输入中的某些字段并输出任何错误记录。我需要读取并存储每个策略组,以便表中一次仅存储 5 条记录,而不是整个文件。 所以我需要读取一个包含 5 条记录
据我了解,LWT 插入始终以 SERIAL 一致性级别完成。如果为 true,这是否意味着读取作为 LWT 插入的行可以安全地以 ANY 的一致性级别读取? 换句话说,我假设 LWT 插入是完全一致的
我看到很多很多通过java脚本读取cookie的函数,但我只想在变量中使用它一次,我是JS新手。 这是我的代码 var TheNumber = (Math.random() + '') * 10000
我正在使用 asp.net 和 C#。我在服务器上部署了一个应用程序[已发布],现在我想查看该网站的代码,据我所知,我可以阅读程序集来查看代码。 请告诉我如何实现它。 提前致谢。 最佳答案 您可以使用
我是一名优秀的程序员,十分优秀!