- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个应用程序从一个文本文件中读取,而该文本文件正在被另一个应用程序同时写入。读取文件的应用程序使用 C - fopen 以文本模式打开它。文件中的行可能很大,大小可达几百兆。出于这个原因,我们有一个函数可以使用 fgets 从文件中读取 4K block 并将其附加到字符串对象中,直到它设法读取完整的一行。尝试读取时,写入文件的应用程序可能写入了部分行。 Out 自定义 ReadLine 函数通过检测文件结尾、将文件指针重新设置到最后一个已知的正确位置并丢弃已经读取的文本来处理这种情况。
下面是该函数的样子:
#define MAX_BUF_SIZE 4096
bool ReadLine(FILE* fp, std::string& result, bool& isEof) {
result.clear();
long const lastOffset = ftell(fp);
bool hasReadOneLine = false;
isEof = false;
debug_print(lastOffset);
while (!hasReadOneLine && !isEof) {
char dataRead[MAX_BUF_SIZE];
memset(dataRead, 0, sizeof(dataRead));
if (fgets(dataRead, MAX_BUF_SIZE, fp) == NULL) {
if (feof(fp)) {
debug_print("Flag 1");
isEof = true;
} else {
debug_print("Flag 2");
result.clear();
fseek(fp, lastOffset, SEEK_SET); //reset the file pointer to where it was
return false;
}
}
result += dataRead;
hasReadOneLine = (result[result.length()-1] == '\n');
} // end loop
if (!hasReadOneLine) {
debug_print("Flag 3");
result.clear();
fseek(fp, lastOffset, SEEK_SET); //reset the file pointer to where it was
return false;
}
// drop the new-line character ...
if (result[ result.length()-1] == '\n') {
result.resize(result.size() - 1);
}
return true;
}
问题:我遇到过这样一种情况,在从文件中读取整行后,ReadLine() 函数在再次调用以读取下一行时返回先前读取的行的最后一个 block 。我记录了 ftell() 返回的 lastOffset 的值,并注意到在这种罕见的情况下,fgets 没有将文件指针移动到它读取的行的末尾。
我添加了一些调试行,但在我的例子中,唯一打印的是 lastOffset 值。
在 ReadLine 返回不完整行的调用中,lastOffset 的值为:21563617不完整行的长度为:920
在返回完整行之前的调用中,lastOffset 的值为:21442207上一次调用中读取的行的长度是:122331(包括换行符)
我的问题是:有没有人遇到过类似的问题?您对可能出现的问题有何看法?我不一定要寻找完整的答案,而只是寻找一些可能出错的提示。
**更新**
我设法用一个小实用程序重现了这个问题,以 4K 的 block 写入一个文件, sleep 间隔为 10 毫秒,而另一个程序(使用上述功能)同时从同一个文件读取。
看起来像执行 fseek() 来重新设置文件指针在上面的函数中是一个错误的选择,因为将文件指针重新设置到以前的位置并不一定会清除 C 库自己的内部缓冲区。我仍然不完全相信这个解释,因为在某些情况下(重现案例)文件指针重置从未发生过。
无论如何,我在网上做了更多搜索,有些线程似乎建议使用较低级别的流并在库本身中处理缓冲。所以我改变了上面函数的实现和它的其他助手来做到这一点。我现在使用 Windows 的 _sopen_s()/_read()/_lseek() 和 Linux/Solaris 的标准 POSIX 接口(interface)来执行较低级别的 IO 处理。通过这些更改,它似乎起作用了,我再也看不到这个问题了。
谢谢大家的宝贵时间。非常感谢您的所有意见。
苏曼
** 更新 2 **
现在我肯定知道原因了。问题是如果文件以文本模式打开,ftell() 和 fseek() 是不可靠的。如果文件以二进制模式打开,则上面的函数可以正常工作。
这是指向其他人之前发现此问题的文章的链接:http://arstechnica.com/civis/viewtopic.php?f=20&t=420490
这是一件好事,因为现在我有了一个需要更改 1 行而不是 200 行的修复程序! :-)
最佳答案
如果您的最大行大小小于 MAX_BUF_SIZE
,那么您可能需要考虑一个可以大大简化您的实现的替代解决方案。简而言之,使用 fread
而不是 fgets
:
void ReadLine(FILE* fp, std::string& result, bool& isEof)
{
static char dataRead[MAX_BUF_SIZE] = {0};
static int dataindex = 0;
int datalength = fread(dataRead,MAX_BUF_SIZE-dataindex,1,fp);
for (int i=0; dataRead[i]!='\n'; i++)
result += dataRead[i];
dataindex = result.length()+1;
memmove(dataRead,dataRead+dataindex,datalength-dataindex);
isEof = feof(fp);
}
注意事项:
此实现假定最后一行(因此文件本身)以换行符结尾。
您可以使用dataRead
/dataindex
作为循环缓冲区以避免memmove
操作。
关于c++ - fgets() 似乎没有正确移动文件指针,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21388323/
我刚接触 C 语言几周,所以对它还很陌生。 我见过这样的事情 * (variable-name) = -* (variable-name) 在讲义中,但它到底会做什么?它会否定所指向的值吗? 最佳答案
我有一个指向内存地址的void 指针。然后,我做 int 指针 = void 指针 float 指针 = void 指针 然后,取消引用它们以获取值。 { int x = 25; vo
我正在与计算机控制的泵进行一些串行端口通信,我用来通信的 createfile 函数需要将 com 端口名称解析为 wchar_t 指针。 我也在使用 QT 创建一个表单并获取 com 端口名称作为
#include "stdio.h" #include "malloc.h" int main() { char*x=(char*)malloc(1024); *(x+2)=3; --
#include #include main() { int an_int; void *void_pointer = &an_int; double *double_ptr = void
对于每个时间步长,我都有一个二维矩阵 a[ix][iz],ix 从 0 到 nx-1 和 iz 从 0 到 nz-1。 为了组装所有时间步长的矩阵,我定义了一个长度为 nx*nz*nt 的 3D 指针
我有一个函数,它接受一个指向 char ** 的指针并用字符串填充它(我猜是一个字符串数组)。 *list_of_strings* 在函数内部分配内存。 char * *list_of_strings
我试图了解当涉及到字符和字符串时,内存分配是如何工作的。 我知道声明的数组的名称就像指向数组第一个元素的指针,但该数组将驻留在内存的堆栈中。 另一方面,当我们想要使用内存堆时,我们使用 malloc,
我有一个 C 语言的 .DLL 文件。该 DLL 中所有函数所需的主要结构具有以下形式。 typedef struct { char *snsAccessID; char *
指针, C语言的精髓 莫队先咕几天, 容我先讲完树剖 (因为后面树上的东西好多都要用树剖求 LCA). 什么是指针 保存变量地址的变量叫做指针. 这是大概的定义, 但是Defad认为
我得到了以下数组: let arr = [ { children: [ { children: [], current: tru
#include int main(void) { int i; int *ptr = (int *) malloc(5 * sizeof(int)); for (i=0;
我正在编写一个程序,它接受一个三位数整数并将其分成两个整数。 224 将变为 220 和 4。 114 将变为 110 和 4。 基本上,您可以使用模数来完成。我写了我认为应该工作的东西,编译器一直说
好吧,我对 C++ 很陌生,我确定这个问题已经在某个地方得到了回答,而且也很简单,但我似乎找不到答案.... 我有一个自定义数组类,我将其用作练习来尝试了解其工作原理,其定义如下: 标题: class
1) this 指针与其他指针有何不同?据我了解,指针指向堆中的内存。如果有指向它们的指针,这是否意味着对象总是在堆中构造? 2)我们可以在 move 构造函数或 move 赋值中窃取this指针吗?
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: C : pointer to struct in the struct definition 在我的初学者类
我有两个指向指针的结构指针 typedef struct Square { ... ... }Square; Square **s1; //Representing 2D array of say,
变量在内存中是如何定位的?我有这个代码 int w=1; int x=1; int y=1; int z=1; int main(int argc, char** argv) { printf
#include #include main() { char *q[]={"black","white","red"}; printf("%s",*q+3); getch()
我在“C”类中有以下函数 class C { template void Func1(int x); template void Func2(int x); }; template void
我是一名优秀的程序员,十分优秀!