- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我是 C 语言的新手,不确定我该怎么做。我发现了类似的问题,但没有完全符合我的要求。
我想做的是“逐句”读取原始 txt 文件,句子结尾被视为句点 (.) 或换行符 (\n)。没有任何数据结构的假定最大长度。
我首先想到的是getline()
,但是要求我使用的C版本好像没有这样的功能。所以我尝试使用 fgets()
然后将数据解析到带有扫描集的 sscanf()
上。 sscanf(charLine, "%[^.]s", sentence);
问题在于,如果有多个句点 (.),它会在第一个句点停止,而不会在该句点 (.) 处再次开始以收集其他句点。
我觉得我走在正确的轨道上,但不知道如何扩展它。
while(fgets (charLine, size, readFile) == NULL)
{
sscanf(charLine, "%[^.]s", sentence);
// something here...
}
最佳答案
您可以编写一个函数来读取流,直到找到 .
或换行符。 David C.Rankin 建议仅扫描 .
可能过于严格,导致 www.google.com 中嵌入的句点充当断句。可以在 .
处停止,如果后跟空格:
#include <ctype.h>
#include <stdio.h>
/* alternative to fgets to stop at `.` and newline */
char *fgetsentence(char *dest, size_t size, FILE *fp) {
size_t i = 0;
while (i + 2 < size) {
int c = getc(fp);
if (c == EOF)
break;
dest[i++] = (char)c;
if (c == '\n')
break;
if (c == '.') {
int d = getc(fp);
if (d == EOF)
break;
if (isspace(d)) {
dest[i++] = (char)d;
break;
}
ungetc(d, fp);
}
}
if (i == 0)
return NULL;
dest[i] = '\0';
return dest;
}
如果你想处理任意长句子,你可以使用指向 dest
和 size
的指针,并在需要时重新分配数组。
请注意,使用 fscanf(fp, "%[^.\n]", dest)
是非常不切实际的,因为无法将最大字节数传递到其中dest
作为评估的参数,需要对空行和句子进行特殊处理。
另请注意,在 .
处停止,即使有上述限制,即它后面必须跟有空格,仍然会导致误报:句子可以包含嵌入的句点,后面跟着不是结束的空格这句话。示例:感谢 David C. Rankin 对我的回答的评论。
关于c - 有没有办法读取文件流,直到找到句点 (.)。然后重复?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56035603/
我有以下字符串: 00:02:44.372 我想使用正则表达式来提取句号/句点。 我尝试过使用: [0-9][0-9]:[0-9][0-9]:[0-9][0-9] 选择持续时间,但我从这里去哪里?由于
我想知道如果我有这样的文件名,我如何去掉文件名中的句点: Test....1.txt 看起来像 Test 1.txt?我不希望像 1.0.1 Test.txt 这样的文件被触及。只有具有连续句点的文件
试图找到一个好的正则表达式来检测java中的句子结尾。主要问题是,如果有数字然后句点,它会将其检测为句子结尾(请参阅演示链接)。但就我而言,我希望它不将其识别为句子结尾,尽管在某些情况下可能是这样。我
我开始学习 Backbone,但 UnderscoreJS 似乎给我带来了一些问题。我收到“意外 token ”。我不确定这意味着什么。我的 JSON 看起来不错,所以我不认为这是一个原因。 var
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
在日期时间选择器控件中,用户必须按.(句点)才能移动到不同的字段(如日、月、年) 我想通过允许用户输入日期而不输入.(句点)来覆盖此行为 有没有什么可以在 C# winforms 中以编程方式实现这一
对于那些不知道 GMAIL 的人,您可以根据原始电子邮件创建无限数量的电子邮件。如果您的电子邮件是“mygmail@gmail.com”,那么这可以通过两种方式实现: 1) 在您的 gmail 末尾的
你们中的一位 CSS 专家可以向我解释一下这个指示符(如果您愿意这样调用它的话)吗?我了解内容,只是不了解 a.button.gold。两个点? a.button.gold{ background-c
很抱歉描述模糊,找不到更好的方式来说明它。 我从 F# 开始,和许多其他人一样,我将解决的欧拉问题转换为 F#。我喜欢使用测试来运行我的代码,也喜欢 FsUnit 风格。在给定示例的帮助下,我这样做了
这是一个奇怪的。通常,当我从powershell执行外部命令时,我使用&运算符,如下所示: & somecommand.exe -p somearguments 但是,今天我遇到了像这样使用的.运算符
我想允许 . 和 a-zA-Z 字母以及 _ 和 -,我的 .. 有一些问题 有什么想法吗? 最佳答案 [A-Za-z_.-] 是一个字符类,包含您提到的所有字符。在字符类中,没有必要对 . 进行转义
所以我知道我需要使用前瞻和后视的东西,但我开始失去理智。 因此,您能否提供一个示例,并解释其含义。 我需要匹配以下序列中的点,但不匹配各个字符之间的点。 this.is.a.sentence.e.g.
在 Python 中,我需要从列表中删除几乎所有标点符号,但保留句点和逗号。我应该创建一个函数来执行此操作还是创建一个变量?基本上我想删除除字母(我已经将大写字母转换为小写)以及句点和逗号(可能还有撇
我只是想选择这些特定“边”的 ID。我已经做了一百万次了,但 jQuery 只是不想与我合作。 $( 'input[name="fd-border"]' ).change(function() {
我正在尝试制作一个正则表达式,它允许使用大小字母 + 数字创建字符串 - a-zA-z0-9 以及字符:。 -_ 如何制作这样的正则表达式? 最佳答案 以下正则表达式应该是您要查找的内容(下面的解释)
我想检查以 number 开头的字符串, period(.)和 space .为此,我使用了 regex但这并没有给出正确的答案。 输入: 1. this a paragaraph1
我在创建正则表达式验证器时遇到问题,该验证器会检查以确保输入仅包含大写或小写字母字符、空格、句点、下划线和破折号。无法通过搜索在线找到此示例。例如: 这些没问题: Dr. Marshall sam s
以下网址有效吗? http://www.example.com/module.php/lib/lib.php 根据https://www.rfc-editor.org/rfc/rfc1738部分 UR
我正在尝试发送一个采用 JSON 对象的 HttpRequest: { "some.setting.withperiods":"myvalue" } 我一直在为我的其他请求创建匿名对象,但我不能
由于大量的搜索,我已经走到了这一步,但我坚持只格式化链接而不格式化文本的方法。我希望链接在文本中包含数字,但没有空格、括号、句号或减号,并保留文本不变。该链接应以 555 123-1234 为例。
我是一名优秀的程序员,十分优秀!