gpt4 book ai didi

javascript - 如何使用 Ruby 和 JavaScript 计算多语言文本中的单词数

转载 作者:数据小太阳 更新时间:2023-10-29 07:56:49 26 4
gpt4 key购买 nike

我想实现的是获取多语言文本中的字数。

比如如果我有一个文本有英文和中文:上届奥运会在北京举行,计数应该是 8,因为有六个英文单词和两个汉字,就像字数在 Microsoft Word 中。

在 Ruby 和 JavaScript 中最好的方法是什么?

最佳答案

我有一个基于“how can i detect cjk characters in a string in ruby”的解决方案。

s = 'The last Olympics was held in 北京'
class String
def contains_cjk?
!!(self =~ /\p{Han}|\p{Katakana}|\p{Hiragana}|\p{Hangul}/)
end
end
s.split.inject(0) do |sum, word|
if word.contains_cjk?
sum += word.length # => ONLY work in Ruby 1.9.
# Search for other methods to do this for 1.8
else
sum += 1
end
end

关于javascript - 如何使用 Ruby 和 JavaScript 计算多语言文本中的单词数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12488565/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com