regex - 如何匹配所有国际化文本？-6ren

regex - 如何匹配所有国际化文本？

转载作者：行者123 更新时间：2023-12-02 17:48:40

25

4

我正在执行搜索和销毁任何亚马逊认为令人反感的任务。过去我通过使用 iconv 将“UTF-8”转换为“latin1”来处理这个问题，但我不能在这里这样做，因为它被编码为“未知”:

test <- "Gwena\xeblle M"
> gsub("\xeb","", df[306,"primauthfirstname"] )
[1] "Gwenalle M"
> Encoding(df[306,"primauthfirstname"])
[1] "unknown"

那么什么正则表达式消除了所有\x## 代码？

最佳答案

我相信这种模式应该有效:

pat <- "[\x80-\xFF]"

test <- c("Gwena\xeblle M", "\x92","\xe4","\xe1","\xeb") 
gsub(pat, "", test, perl=TRUE)
# [1] "Gwenalle M" ""           ""           ""           ""

解释:

之所以有效，是因为字符类 [\x00-\xFF]" 会匹配 \x## 形式的所有字符。但其中的前半部分——第 0 到第 127(或 00 到 7F，十六进制数字)——是 the ASCII characters .所以这是它们的后半部分——第 128 到第 255 个(或者在十六进制模式下第 80 到 FF)——你要搜索并销毁.

关于regex - 如何匹配所有国际化文本？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11369668/

25

4

0

文章推荐： latex - 在org-mode中取消\hypersetup后有什么影响？

文章推荐： floating-point - 截断浮点会产生额外的错误吗？ (AS3)

文章推荐： qt4 - 如何在 QLineEdit 中制作一个额外的图标？

文章推荐： PHP 将变量传递给 array_walk_recursive

Java 国际化
我有一个 Java 字符串，但在处理时遇到了问题。我有一个字符串 s，它的值为丞(我随机选择的一个汉字，我不会说中文)。如果我打电话 String t = new String(s.getBytes(
Qt-国际化(语言切换)
在Qt中,所有的输入部件和文本绘制方式对Qt支持的所有语言都提供了内置的支持。Qt内置的字体引擎可以在同一时间正确而且精细地绘制不同的文本,这些文本可以包含来自众多不同书写系统的字符。如果想了解更多的
表单字段的 Wagtail 国际化
如何实现字段标签、帮助文本等的国际化支持。字段的标准乘法似乎不起作用例如文档中给出的用于创建联系表单的示例。我尝试为其他语言添加额外的字段(文档中描述的第一种方法) from django.db
internationalization - Struts2 + 国际化
是否有可能当我在操作类中使用“getText(”keyName”); 时，我可以指定仅从 ENGLISH 资源包中选择值。因为我只想将此值用于日志记录目的。任何想法我怎么能做到这一点？ BR 标准委
静态文本和特殊字符的 GWT 国际化
我有一些关于 GWT 的国际化解决方法的问题。 1) 处理直接写入 ui.xml 文件的静态文本的最佳方式是什么？目前，我正在使用 Messages-Interface 来翻译 Java 生成的文本
php - Symfony 国际化
我在 Symfony 2 中遇到了一个奇怪的翻译问题。这是我的config.yml imports: - { resource: parameters.yml } - { resou
用于动态生成内容的 GWT 国际化
对于我的大部分应用程序，我可以使用 https://developers.google.com/web-toolkit/doc/latest/DevGuideI18n 中列出的推荐国际化技术。 (主要
Flutter 国际化，国际代码生成不起作用
我使用 Android Studio 创建了一个新的 Flutter 项目。我正在使用null-safety，并且正在物理设备上运行应用程序，但代码生成无法正常工作，没有flutter_gen.dar
Java 国际化 - 我是否必须为每个类加载资源包？
这里是菜鸟。我正在尝试对基于命令行的程序实现国际化。以下是 java 国际化路径中可用的内容。 import java.util.*; public class I18NSample { s
Flutter 国际化，国际代码生成不起作用
我使用 Android Studio 创建了一个新的 Flutter 项目。我正在使用null-safety，并且正在物理设备上运行应用程序，但代码生成无法正常工作，没有flutter_gen.dar
iOS 国际化 Storyboard未显示
我正在开发一个需要多语言的应用程序。我正在尝试关注 this国际化教程。但是，当我尝试“使用基本国际化”时， View 中没有列出我的 Storyboard。我正在使用 XCode 4.6.3 我
本地语言的 java 国际化
我住在印度(有超过20种语言)我正在尝试在网站中实现java国际化。但是在 Locale.getAvailableLocales() 中，本地语言不可用。我的情况是否可以实现国际化？如果可能的话字
Neo4j SDN 国际化
我有以下 SDN 4 实体: 决策、特征和值: @NodeEntity public class Value { private final static String SET_FOR = "
sql - 国际化 - 支持所有语言的字符集？
关于MySql，是否有支持所有或绝大多数语言的字符集？最佳答案统一码。它有几种编码:UTF-8、UTF-16 和 UTF-32。来自 http://en.wikipedia.org/wiki/U
javascript - Vuepress 国际化
我目前正在使用 Vuepress。但是我想要在我的 Vuepress 站点中使用多种语言。经过 3 天的挣扎，我决定把我的问题放在这里。 (是的，我查看了 Vuepress 文档:https://vu
Python 国际化，独立于本地设置
我需要返回一个 strftime() 调用，该调用使用与我本地机器/操作系统上设置的语言不同的语言。是否可以选择返回语言？最佳答案对于可靠的 i18n/L10N，可由必须在同一运行中提供不同本地化
ios - 国际化 UIButton
我有一些按钮，按下它们后我想播放一些音频。按钮的名称是音频文件的名称 private func playAudio(title : String){ audioPlayer = AVAudio
validation - HTML5 国际化
如何更改 HTML5 的消息(或者它会根据浏览器的语言自动更改？) 例如: E-mail: 当我在 Opera 运行此代码(来自 W3schools)
url - 国际化 - 是否翻译网址
我发现很多关于 url schemes 的话题，最常见的是: www.mysite.com/fr/products www.mysite.com/en/products www.mysite.com/
Android WebView 国际化
在 Android WebView 中处理国际化/本地化的最佳方式是什么。理想情况下，我想访问以下位置的所有字符串资源: res/values/strings.xmlres/values-de/str

首页

博学

6Ren·AI

商城

regex - 如何匹配所有国际化文本？