作者热门文章
- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我想实现的是获取多语言文本中的字数。
比如如果我有一个文本有英文和中文:上届奥运会在北京举行
,计数应该是 8,因为有六个英文单词和两个汉字,就像字数在 Microsoft Word 中。
在 Ruby 和 JavaScript 中最好的方法是什么?
最佳答案
我有一个基于“how can i detect cjk characters in a string in ruby”的解决方案。
s = 'The last Olympics was held in 北京'
class String
def contains_cjk?
!!(self =~ /\p{Han}|\p{Katakana}|\p{Hiragana}|\p{Hangul}/)
end
end
s.split.inject(0) do |sum, word|
if word.contains_cjk?
sum += word.length # => ONLY work in Ruby 1.9.
# Search for other methods to do this for 1.8
else
sum += 1
end
end
关于javascript - 如何使用 Ruby 和 JavaScript 计算多语言文本中的单词数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12488565/
我是一名优秀的程序员,十分优秀!