c - 查找 2 个字符串是否由相同单词组成的函数-6ren

c - 查找 2 个字符串是否由相同单词组成的函数

转载作者：太空宇宙更新时间：2023-11-04 04:46:31

26

4

我需要在 C 中创建一个函数，用于查明 2 个字符串是否由相同的单词组成。从当前代码中可以看出，我将每个字符串加载到单独的数组中。我做到了，在数组中有单词，都是小写字母，每个单词之间只有 1 个空格，并且没有所有非字母字符。我虽然可以对字符串进行排序并在它们上调用 strcmp，但不能这样做，因为可能有诸如 "dog dog dog cat"和 "dog cat"之类的字符串，这些字符串来自相同的单词，因此该函数应该返回 1，但如果只是排序并使用 strcmp 则不会。所以我虽然可以将所有重复的单词合并为 1，然后进行排序和 strcmp，但是仍然存在一个问题，即当出现诸如“dog”和“god”之类的单词时，这是两个不同的单词，但是函数排序后仍会将它们视为相同。“dog dog dog cat” “dog cat” - 相同的词“HI HeLLO!!'” “hi,,,hello hi” - 相同的词如果有任何帮助，我将不胜感激。我真的不知道如何创建它，我坐了很长时间仍然想不通。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ctype.h>

int sameWords( const char * a, const char * b)
{
char * array1=NULL;
char * array2=NULL;
int length1=0, length2=0, i=0, j=0;
while(a[i])
  {
  if(i>=length1)
    {
      length1+=250;
      array1=(char*)malloc(length1*sizeof(char));
    }
  if(isspace(a[i]) && !isspace(a[i-1]))
    {
      array1[i]=a[i];
    }
  if(isalpha(a[i]))
    {
      array1[i]=tolower(a[i]);
    }
  i++;
  }
while(b[j])
  {
  if(j>=length2)
    {
      length2+=250;
      array2=(char*)malloc(length2*sizeof(char));
    }
  if(isspace(b[j]) && !isspace(b[j-1]))
    {
      array2[j]=b[j];
    }
  if(isalpha(b[j]))
    {
      array2[j]=tolower(b[j]);
    }
  j++;
  }
}

int main()
{
sameWords("This' is   string !!! ", "THIS stRing is !!  string ");
return 0;
}

最佳答案

您已经了解了解决问题的两种方法。复杂的是将每个字符串拆分成单词，对它们进行排序，然后剔除重复项，这在排序数组中很容易。更简单的方法是将第一个字符串拆分为单词，然后在第二个字符串中搜索每个单词。然后反过来做同样的事情:拆分第二个并检查第一个中的单词。

这两种方法都需要您拆分字符串。这也是您的代码似乎存在问题的地方。 (你已经有了基本的思路，看单词边界，但你似乎不知道如何存储单词。)

基本问题是:您将如何表示单词，即 C 字符串的子字符串？有多种方法。您可以使用指向字符串的指针和字符串长度，也可以将它们复制到另一个缓冲区。

下面是一个将字符串 a 拆分为单词然后检查是否可以在 b 中找到每个单词的算法:

/*
 *      Return 1 if all words in a can be found in b, 
 *      return 0 otherwise.
 */
int split_and_check(const char *a, const char *b)
{
    int begin = -1;    /* marker for beginning of word */
    char word[80];     /* temporary buffer for current word */
    int prev = 0;      /* previously read char to detect word bounaries */
    int len;           /* current length of word */
    int i;

    i = 0;
    while (1) {
        if (isalpha(a[i])) {
            if (!isalpha(prev)) {
                begin = i;
                len = 0;
            }
            if (len < 80) word[len++] = a[i];
        } else {
            if (len > 0) {
                word[len] = '\0';       /* manually null-terminate word */

                if (strstr(b, word) == NULL) {
                    /* fail on string mismatch */
                    return 0;
                }
                len = 0;                /* reset word-length counter */
            }
        }
        if (a[i] == '\0') break;        /* check end here to catch last word */
        prev = a[i++];
    }

    return 1;
}

当前单词存储在本地字符缓冲区word 中，长度为len。请注意在 b 中搜索 word 之前如何将零结束标记 '\0' 手动添加到 word 中:库函数 strstr 在另一个字符串中查找字符串。两个字符串都必须以零结尾。

这只是解决方案的一半。您必须以相反的方式检查字符串:

int same_words(const char *a, const char *b)
{    
    if (split_and_check(a, b) == 0) return 0;
    if (split_and_check(b, a) == 0) return 0;

    return 1;
}

这还不是您问题的确切解决方案，因为字符串匹配是区分大小写的。我跳过了这部分，因为这样更容易:strstr 区分大小写，我不知道有任何忽略大小写的变体。

关于c - 查找 2 个字符串是否由相同单词组成的函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20331998/

26

4

0

文章推荐： html - 菜单栏中事件元素的不同颜色

文章推荐： c - fork() 和 waitpid 可能的输出

文章推荐： android - 了解 iphone 和 android 中的 HTML 字体大小差异

scala - 记录作为参数，组成
编辑:我将问题重新表述为更简单且不那么特定领域的问题: 在下面的代码中，我想实现 mplus 函数，该函数结合了受特定字段存在约束的两个函数。结果函数应受两个字段的存在的约束。谢谢 ! import
docker 组成 |虚拟主机
我的代码有什么问题？提前致谢! 我正在尝试为我的 docker 容器设置一个虚拟主机。在本地主机上:8000 完美运行，但是当我尝试通过 http://borgesmelo.local/访问时，出现错
html - 如何让标题的三个背景线由两个单独的 block 组成？
这个问题在这里已经有了答案: CSS technique for a horizontal line with words in the middle (34 个答案) 关闭 2 年前。首先，这是
javascript - React js 组成
我是 React Js 的新手，并尝试了解如何通过 ajax 对从不同来源获得的数据进行组合(如下所述: Reactjs - loadResourcesFromServer - combine two
docker 组成 : services cannot connect to each other
我一直在关注 this tutorial在 docker 服务和 swarms 上。但是我在不同 docker 容器之间的网络连接上遇到了一些问题。以下是我的 docker-compose.yml
docker 组成。同一容器上另一个卷内的卷。它是如何工作的？
我正在尝试创建一个相对简单的设置来开发和测试 npm 包。事实上，一个问题是，在将代码卷安装到容器后，它会替换 node_modules。我尝试了很多通常合乎逻辑的东西，主要是为了将 node_mo
scala - 组成 future 和期权
我有四种类型A、B、C和D，初始值x Future[Option[A]] 和三个函数:f1: A => Option[B] , f2: B => Future[Option[C]] 和 f3: C =
java - 一个词是否由土耳其语字符(可能带有数字)组成？
我有一个包含单词的语料库。我想对他们做一个分析。我接受它们是土耳其字符，但其中一些不是。所以我想检查一个词是否不包含土耳其字符或数字。我的意思是: hey4 valid 33 vali
java - 查找二维数组的主要和次要对角线是否由 0 组成
这是我正在为 Java 入门课解决的学校问题。作业是编写一个程序，生成一个由随机生成的二进制数组成的 8 x 8 矩阵，并让程序检查哪些列(如果有)全为 0，以及主对角线和次对角线是否也由零组成。主对
python - RecursionError 组成 lambda
我正在尝试编写一个由任意数量的 lambda 函数组成的函数。我有两个简单的 lambda 函数。 f = lambda x: x + 1 g = lambda x: x**2 我对组合函数的尝试是
docker 组成 : Cannot connect to Redis
我在这里学习 Docker Compose 教程 https://docs.docker.com/get-started/part5/#recap-optional version: "3" serv
android - Jetpack 组成 : No method shouldWaitForActivitiesToComplete()
我正处于要为应用程序编写 androidTests 的状态。阅读 Testing Compose 的文档，我创建了一个文件并编写了一个简单的测试来检查进度: ExamineTest.kt: clas
puppet - puppet 继承VS puppet 组成
我最近刚跨过木偶继承。围绕它的几个问题：使用p继承是一种好习惯吗？一些经验丰富的木偶同事告诉我，木偶的继承不是很好，我不太相信。来自OO世界，我真的很想了解木偶继承的原理，以及覆盖的原理。最佳答
docker 组成 -d :image not created
我正在尝试使用 docker-compose 创建一个基本网页这是我的 yml 文件 identidock: build: . ports: - "5000:5000" envir
docker - Docker + docker-组成+无法启动服务
我们有docker-compose.yml，其中包含Kafka，zookeeper和schema registry的配置当我们启动docker compose时，出现以下错误 docker-comp
haskell - 组成 "length of sum"是什么意思？
我在玩 Haskell 的类型时无意中发现了 length 。总和有效。是否有一些语义应该允许它工作，或者这仅仅是类型定义的一个缺点？我在下面编写了每个类型定义。 length :: Foldabl
java - JPanel 由 textFields 组成
如何防止缩小仅包含 JFormattedTextFields 的 JPanel。 JFormattedTextField textF1; JFormattedTextField textF2;
nginx - docker 组成 : volumes and user
我尝试更 retrofit 载我的 Docker 卷的用户，但执行此操作的是“root”用户，而不是“安全用户”。知道如果我在 Dockerfile 中执行“chown -R/var/www”，这将不
scala - 组成 scalaz io 效果对象
我正在尝试将 scalaz 的 ioeffect IO[E,A] monad 用于一段非常有效的代码。我试图用 IO[E,A] 在高层次上重写的代码需要一些关于存储在云中的文件的元数据。代码试图:
java - java中的正则表达式尝试匹配特定格式的字符串(格式由 | sysbol 组成)
这个问题已经有答案了: What special characters must be escaped in regular expressions? (13 个回答) 已关闭 5 年前。 java中

首页

博学

6Ren·AI

商城

c - 查找 2 个字符串是否由相同单词组成的函数