作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试创建一个尝试匹配句子的正则表达式。
这是一个片段。
local utf8 = require 'lua-utf8'
function matchsent(text)
local text = text
for sent in utf8.gmatch(text, "[^\r\n]+\.[\r\n ]") do
print(sent)
print('-----')
end
end
但是,它不像在 python 中那样工作。我知道 Lua 使用不同的正则表达式模式集并且它的正则表达式功能是有限的,但为什么上面的正则表达式给我一个语法错误?在 Lua 中匹配正则表达式的句子会是什么样子?
最佳答案
请注意,Lua 使用 Lua 模式,它们不是“正则”表达式,因为它们无法匹配正则语言。它们几乎不能用于将文本拆分成句子,因为您需要考虑各种缩写、空格、大小写等。要将文本拆分成句子,由于复杂性,您需要一个 NLP 包而不是一两个正则表达式任务。
关于
why does the regex above give me a syntax error?
您需要在 Lua 模式 中用 %
符号转义特殊符号。查看示例代码:
function matchsent(text)
for sent in string.gmatch(text, '[^\r\n]+%.[\r\n ]') do
print(sent)
print("---")
end
end
matchsent("Some text here.\nShow me")
关于lua - 如何在Lua中匹配一个句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39327759/
我是一名优秀的程序员,十分优秀!