arrays - Golang : process took too long. 实现拼写检查-6ren

arrays - Golang : process took too long. 实现拼写检查

转载作者：IT王子更新时间：2023-10-29 01:27:20

26

4

http://play.golang.org/p/H5E0ExL85d

我已经用 Go 实现了一些 Peter Norvig 的拼写检查算法。

奇怪的是，前三个 调用工作正常，为我提供了所需的输出。

但从第二个开始，它说“处理时间太长。”

谁能看看我的代码并告诉我哪里出了问题？

这是可能出错的片段。

在英文版中使用相同的代码，一切都完美无缺。

UNICODE 格式和边界已根据语言发生变化，因为英语每个字母包含 1 个字节，而亚洲语言在这种情况下每个字符包含 3 个字节。

这是在尝试运行与英语运行完美的算法相同的算法。但这不起作用。

total_set := []string{}
for _, elem := range splits {

    if len(elem.str2) > 3 {
        //deletion
        total_set = append(total_set, elem.str1+elem.str2[3:])

        //replace
        for i:=0; i<len(koreanletter)/3; i++ {
            total_set = append(total_set, elem.str1+string(koreanletter[3*i:3*(i+1)])+elem.str2[3:])
        }

        //transpose
        if len(elem.str2) > 9 {
            total_set = append(total_set, elem.str1+string(elem.str2[3:6])+string(elem.str2[:3])+elem.str2[9:])
        }

    } else {
        //deletion
        total_set = append(total_set, elem.str1)
    }

    //insertion
    for _, c := range koreanletter {
        total_set = append(total_set, elem.str1+string(c)+elem.str2)
    }
    return RemoveDuplicateStringArrayForKorean(total_set)
}

英文的在下面。这是完美的工作。

//Edits1 is to measure the distance between strings.
func (model *Model) Edits1(word string) []string {
  const alphabet = "abcdefghijklmnopqrstuvwxyz"

  splits := []Pair{}
  for i := 0; i <= len(word); i++ {
    splits = append(splits, Pair{word[:i], word[i:]})
  }

  total_set := []string{}
  for _, elem := range splits {

    if len(elem.str2) > 0 {
      //deletion
      total_set = append(total_set, elem.str1+elem.str2[1:])

      //replace
      for _, c := range alphabet {
        total_set = append(total_set, elem.str1+string(c)+elem.str2[1:])
      }

      //transpose
      if len(elem.str2) > 1 {
        total_set = append(total_set, elem.str1+string(elem.str2[1])+string(elem.str2[0])+elem.str2[2:])
      }

    } else {
      //deletion
      total_set = append(total_set, elem.str1)
    }

    //insertion
    for _, c := range alphabet {
      total_set = append(total_set, elem.str1+string(c)+elem.str2)
    }
  }
  return RemoveDuplicateStringArrayLowerCase(total_set)
}

添加:有序参数，现在我有三样东西在工作。

韩语字母中没有一个字符丢失。

无论如何我可以更具体地看到错误？我就是想不通。

最佳答案

研究您的代码，似乎是您的 KoreanKnownEdits2 花费了太长时间。在你的第四个例子(失败的那个)中， model.KoreanEdits1(input_word) 的长度是 28197 而第一个 model.KoreanEdits1(elem1) 的长度 是 23499，这使得大约有 6.62 亿个案例需要尝试。程序似乎在前 147,000 次后失败，因为它花费的时间太长 ( playground )。

任何不需要调用 KoreanKnownEdits2 的例子似乎都有效，所以我怀疑你应该重写这个函数以避免穷举搜索，或者至少将它限制在一个更合理的大小，如果你想在 Playground 的时间限制下使用它。我还没有足够详细地研究你的代码，无法 100% 确定这一点，但我怀疑西方字母表的 26 个字母使其易于管理英文版本，而扩展的韩文字母表使你的输入量太大而无法使用在 playground 的时间限制内处理，无论每个字符编码的字节数如何。

关于arrays - Golang : process took too long. 实现拼写检查，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19806628/

26

4

0

文章推荐： git - 使用 Git Bash 显示当前目录中的文件？

文章推荐： linux - 是否可以增加 ksh 变量接受的最大字符数？

文章推荐： git - 错误 : The source control operation failed because the revisions

string - golang - 用数字替换字符串字符 golang
我正在尝试运行这段代码，用随机数替换字符串中的一个字符: //Get the position between 0 and the length of the string-1 to insert
arrays - 在数组 golang 中连接整数 - GoLang
我有一个包含 3 个位置的数组，假设它的所有位置都是数字 5。 [5 5 5] 我怎样才能以保持 555 的方式将它传递给 var？就像这样。 n:= 555 最佳答案与使用任何其他语言的方式相同:
Golang 使用 golang dep with dep
我使用 go dep 工具版本 v0.4.1，现在当我运行 dep init 时它会按预期创建 2 个文件，当我打开 gopkg.lock 我发现例如以下内容 [[projects]] name
Golang 可变参数构造函数？在 Golang 中创建个人联系人？
我正在制作学习联系申请。我有一个 NewContact()。 // Contact - defines the fields of an entire Contact type Contact str
Golang - smb2 模块 + 对 Golang 的基本了解
我一直在尝试使用该模块: https://godoc.org/github.com/hirochachacha/go-smb2#RemoteFile.ReadAt 为了在 Windows 机器上对我的
go - 如何在 golang 代码中编译 golang 程序？
我需要在 golang 中编译 golang 中的程序。有没有不使用 exec.Command("go","build") 的原生形式？最佳答案不幸的是，我认为使用 exec.Command 是利
golang : given a string, 输出一个等效的 golang 字符串文字
编写输出有效 go 代码的 go 应用程序可能最好使用内置的“go”包及其一些子包(“go/ast”、“go/token”、“go/printer”、等)。要创建字符串文字表达式，您需要创建一个 a
Golang gin 代理处理 svelte 前端和 Golang api
我正在尝试使用 Golang 和 gin 为我的 api 和前端编写代理。如果请求转到除“/api”之外的任何内容，我想代理到 svelte 服务器。如果出现“/api/something”，我想在
linux - 如何自定义 golang-docker 镜像以使用 golang 进行脚本编写？
我偶然发现了这个博客:using go as a scripting language并尝试创建一个可用于运行 golang 脚本的自定义图像，即 FROM golang:1.15 RUN go ge
json - golang 将具有数组列表的 json 转换为 golang 中的结构
我刚开始接触golang，我需要从json字符串中获取数据。 {"data" : ["2016-06-21","2016-06-22","2016-06-25"], "sid" : "ab", "di
go - 为什么在 Golang 中我们真的需要 "fallthrough"？哪个用例让 Golang 的创建者首先将其包含在内？
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 3 年前。 Improve
go - 如何使 golang 的 golang 版本和我的 Dockerfile 保持同步？
我是 goland 的新手，试图在我的第一个项目中使用它。我注意到在 goland 中它没有显示通过容器引入的相同 golang SDK。这是我的 Dockerfile: FROM golang:1
golang 和 neo4j 使用 golang-neo4j-bolt-driver
我正在试用 golang-neo4j-bolt-driver 包 github.com/johnnadratowski/golang-neo4j-bolt-driver 我已经导入了包并正在使用创建新
go -/usr/lib/golang/src和/usr/lib/golang/pkg之间是什么关系
如果我安装了Go发行版软件包，则会在/usr/lib/golang/pkg中看到很多文件，在/usr/lib/golang/src中看到非常相似的文件集。这两组之间有什么关系？ pkg是从src中的源
go - 如何使用 golang 上下文功能而不是 golang http 客户端发出 http 请求？
我发现 golang 上下文对于在客户端-服务器请求范围内取消服务器的处理很有用。我可以使用 http.Request.WithContext 方法发出带有上下文的 http 请求，但是如果客户端不
html - 如何在 golang gin web 框架中使用 golang 数据呈现 HTML？
我正在尝试将一个 golang 数组(还有 slice、struct 等)放置到 HTML 中，这样当从 golang gin web 框架返回 HTML 时，我可以在 HTML 元素内容中使用数组元
Golang exec.Command() 错误 - 通过 golang 的 ffmpeg 命令
目前正在使用这个 ffmpeg 命令编辑视频 ffmpeg -i "video1.ts" -c:v libx264 -crf 20 -c:a aac -strict -2 "video1-fix.ts
go - 如何从共享的 play.golang.org url 中检索 golang 代码
我需要从 play.golang.org 链接读取 golang 代码并保存到 .go 文件。我想知道 play.golang.org 是否有任何公共(public) API 支持。我用谷歌搜索但没有
intellij-idea - 使用 IntelliJ Golang 插件，如何运行整个 Golang 项目而不是单个文件？
我第一次使用 IntelliJ 的最新 (2014-01-03) Golang 插件。通常，我的终端工作流程是 go build && ./executable -args=1 所以我试图创建一个启
go - 如何解决 Golang 在 golang.org/x/tools/go 中找不到包？
这个问题只是在构建之间随机出现，现在甚至我们的生产 repo，几个月都没有改变，在构建时也会出现这个问题。我已经坚持了一段时间。它不会发生在我们的本地机器上，只有在使用 dockerfile 时才会发

首页

博学

6Ren·AI

商城

arrays - Golang : process took too long. 实现拼写检查