- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
strtok
彻底崩溃了吗?
在 StackOverflow 上有关 C 文本解析的许多问题上,有人会建议使用 strtok
,一个常见的答复是永远不应该使用 strtok
,它已经被彻底破坏了。
一些发帖者声称strtok
的问题仅限于多线程问题,在单线程环境中是安全的。
正确答案是什么?
有效吗?
是不是已经彻底崩溃了?
你能用例子来支持你的答案吗?
最佳答案
是的,strtok
已经无可救药地被破坏了,即使在一个简单的单线程程序中,我将用一些示例代码来演示这个失败:
让我们从一个简单的文本分析器函数开始,使用 strtok
收集有关文本句子的统计信息。此代码将导致未定义的行为。
在此示例中,句子是一组由空格、逗号、分号和句点分隔的单词。
// Example:
// int words, longest;
// GetSentenceStats("There were a king with a large jaw and a queen with a plain face, on the throne of England.", &words, &longest);
// will report there are 20 words, and the longest word has 7 characters ("England").
void GetSentenceStats(const char* sentence, int* pWordCount, int* pMaxWordLen)
{
char* delims = " ,;."; // In a sentence, words are separated by spaces, commas, semi-colons or period.
char* input = strdup(sentence); // Make an local copy of the sentence, to be modified without affecting the caller.
*pWordCount = 0; // Initialize the output to Zero
*pMaxWordLen = 0;
char* word = strtok(input, delims);
while(word)
{
(*pWordCount)++;
*pMaxWordLen = MAX(*pMaxWordLen, (int)strlen(word));
word = strtok(NULL, delims);
}
free(input);
}
这个简单的函数可以工作。到目前为止还没有错误。
<小时/>现在让我们扩充我们的库,添加一个收集文本段落统计信息的函数。
段落是由感叹号、问号和句点分隔的一组句子。
它将返回段落中的句子数以及最长句子中的单词数。
也许最重要的是,它将使用之前的函数 GetSentenceStats
来帮助
void GetParagraphStats(const char* paragraph, int* pSentenceCount, int* pMaxWords)
{
char* delims = ".!?"; // Sentences in a paragraph are separated by Period, Question-Mark, and Exclamation.
char* input = strdup(paragraph); // Make an local copy of the paragraph, to be modified without affecting the caller.
*pSentenceCount = 0;
*pMaxWords = 0;
char* sentence = strtok(input, delims);
while(sentence)
{
(*pSentenceCount)++;
int wordCount;
int longestWord;
GetSentenceStats(sentence, &wordCount, &longestWord);
*pMaxWords = MAX(*pMaxWords, wordCount);
sentence = strtok(NULL, delims); // This line returns garbage data,
}
free(input);
}
这个函数看起来也非常简单明了。
但它不起作用,如本示例程序所示。
int main(void)
{
int cnt;
int len;
// First demonstrate that the SentenceStats function works properly:
char *sentence = "There were a king with a large jaw and a queen with a plain face, on the throne of England.";
GetSentenceStats(sentence, &cnt, &len);
printf("Word Count: %d\nLongest Word: %d\n", cnt, len);
// Correct Answer:
// Word Count: 20
// Longest Word: 7 ("England")
printf("\n\nAt this point, expected output is 20/7.\nEverything is working fine\n\n");
char paragraph[] = "It was the best of times!" // Literary purists will note I have changed Dicken's original text to make a better example
"It was the worst of times?"
"It was the age of wisdom."
"It was the age of foolishness."
"We were all going direct to Heaven!";
int sentenceCount;
int maxWords;
GetParagraphStats(paragraph, &sentenceCount, &maxWords);
printf("Sentence Count: %d\nLongest Sentence: %d\n", sentenceCount, maxWords);
// Correct Answer:
// Sentence Count: 5
// Longest Sentence: 7 ("We were all going direct to Heaven")
printf("\n\nAt the end, expected output is 5/7.\nBut Actual Output is Undefined Behavior! Strtok is hopelessly broken\n");
_getch();
return 0;
}
对 strtok
的所有调用都完全正确,并且基于单独的数据。
但结果是未定义的行为!
为什么会发生这种情况?
当调用 GetParagraphStats 时,它会开始一个 strtok 循环来获取句子。在第一句话中,它将调用 GetSentenceStats
。 GetSentenceStats
也将是一个 strtok
循环,丢失由 GetParagraphStats
建立的所有状态。当GetSentenceStats
返回时,调用者(GetParagraphStats
)将再次调用strtok(NULL)
以获取下一个句子。
但是 strtok
会认为这是一个继续之前操作的调用,并将继续对现在已释放的内存进行标记!结果是可怕的未定义行为。
什么时候使用 strtok 是安全的?
即使在单线程环境中,strtok
只有只有当程序员/架构师确定以下两个条件时才能安全使用:
使用 strtok
的函数绝不能调用任何可能也使用 strtok 的函数。
如果它调用也使用 strtok 的子例程,则它自己对 strtok 的使用可能会被中断.
使用 strtok
的函数绝不能被任何也可能使用 strtok 的函数调用。
如果此函数曾被另一个使用 strtok 的例程调用,则此函数将中断调用者使用strtok。
在多线程环境下,使用strtok
就更不可能了,因为程序员需要确保当前只有一次使用strtok
线程,而且也没有其他线程使用 strtok
。
关于c - strtok坏了吗?或者只是棘手?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28588170/
我有以下两个表: T1(身份证,名字)T2 (id,hybrid_col) 我想做的是从 T2 中选择所有内容,如果 hybrid_col 是数字,则使用 T1 加入。基本上,hybrid_col 持
这是代码:https://play.golang.org/p/Sizbc3uJt_c 我尝试替换这个简单的循环 for c := n.FirstChild; c != nil; c = c.NextS
我在大学参加了微软编码挑战,提出的问题是: Write a program that takes two strings as input, one is a query, and the other
我需要比较以下函数的增长率: f(n)=2^n 和 g(n)=n^log(n)(当 n 接近正无穷大时)。 这可能吗? 最佳答案 令 n = 2^k。我们有: 2^n = 2^(2^k) n^log(
我的服务器快满了,我需要自动删除文件。文件通常每天都会添加到我的服务器,但有时会有暂停,使它们每两周或每月一次。他们停止进来几个月然后又开始了,这是不可预测的。 我的脚本需要删除超过 30 天的文件但
我无法获得适用于 SonarQube 4.0 的代理配置,以便我可以安装插件。 当我打开 http://localhost:9000/updatecenter/available它显示错误:“未连接到
标题不是很清楚,但很难描述我遇到的问题。 让我们考虑一个实现了 == 和 != 方法的 Signal 类。 (这是我的简化版)。 import numpy as np class Signal:
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我想将焦点设置到我网站上的文本字段。有两个问题: 文本字段位于外部页面(我无法控制)。它使用 iframe 嵌入到我的页面中。 每次加载页面时,文本字段都会生成一个自己的随机 ID。 这是我想要聚焦的
我有一个非常棘手的问题,我现在正试图弄清楚它, 我有这个查询结果集 SELECT * FROM Orders OrderID | OrderAmount | OrderDate | E
当我启动 webkit 浏览器实例并输入 http://localhost 时,$this.innerWidth()的结果是对的(我用的是jQuery)。 但是如果我尝试刷新页面, $this.inn
首先我知道有很多人问过这个问题!但我还有一个问题。 我正在做的是,通过 phpmyadmin 将我的数据库 (MySql) 导出到 .sql 文件。没问题。当我尝试将其导入“SQLite Databa
我这里有一个棘手的问题..请帮助.. 我有一个名为“DemoViewController”的 ViewController,两个不同的 Xib(Demo1Controller.xib 和 Demo2C
哦,嗨。我是一名初级 Java 开发人员,在空闲时间从事一些基于 2D 图 block 的游戏。现在我正在尝试实现游戏模型中非常基本的东西 - 各种类型的对象如何彼此交互。我希望有一天添加网络支持,所
假设我有以下两个表: PRICE price_id price room_id nr_of_people 1 80 1
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我正在开发一个 jQuery 插件,人们可以将其包含在自己的页面中。该插件在我正在操作的位于不同域的服务中生成作业。 为了突破域边界,我使用 jQuery 的 JSONP 功能,它可以很好地生成作业。
我看到很多开发人员只是盲目地按照分步说明将 JAX-WS RI jar 复制到 Tomcat 认可文件夹。也没有看到有人问为什么。 1) 如果 JDK 6 update 4+ 已经包含 JAX-WS
我找不到解决这个问题的方法。 这是我想要的渲染图: http://jsfiddle.net/kQSxb/ HTML: Lorem ipsum dolor s
我是一名优秀的程序员,十分优秀!