- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要编写一个实用程序,该实用程序将从中删除一些特殊字符给定的字符串输入。我无法理解,我该如何完成这项任务。我已被给予一个数据库程序,它执行相同的操作,我需要在java代码中复制相同的算法。我把程序放在这里。
create or replace procedure dbimm.check_arabic_letters (name_a in out varchar2) as
pos number(3);
strlen number(3);
nxtchar char(1);
ascval number(3);
begin
replace_mult_spaces(name_a);
strlen := length(name_a);
pos := 1;
while pos <= strlen loop
nxtchar := substr(name_a, pos, 1);
ascval := ascii(nxtchar);
-- dbms_output.put_line(to_char(ascval));
if (ascval between 193 and 218) or
(ascval between 225 and 234) or
(ascval in (32,38,40,41,47,247, 248, 249, 250))
then
pos := pos + 1;
else
raise_application_error(-20000,display_message(9));
end if;
end loop;
name_a := replace(name_a, 'ي ','ى ');
if substr(name_a, strlen) = 'ي' then
name_a := substr(name_a, 1, strlen - 1) || 'ى';
end if;
name_a := replace(name_a, 'ة ', 'ه ');
if substr(name_a, strlen) = 'ة' then
name_a := substr(name_a, 1, strlen - 1) || 'ه';
end if;
/* Old code commented by Mobeen
name_a := replace(name_a, ' عبد ',' عبد');
if instr(name_a,'عبد ') = 1 and length(name_a) > 4 then
name_a := substr(name_a, 1, 3) || substr(name_a,5);
end if;
*/
-------
name_a := replace(name_a,'أ','ا');
name_a := replace(name_a,'إ','ا');
name_a := replace(name_a,'آ','ا');
--m name_a := replace(name_a,'لا','?');
name_a := replace(name_a,chr(250),'لا');
name_a := replace(name_a,chr(247),'لا');
name_a := replace(name_a,chr(248),'لا');
name_a := replace(name_a,chr(249),'لا');
name_a := replace(name_a,chr(63),'لا');
--- New Code added by Patrick
name_a := replace(name_a, ' عبد ال', ' عبدال');
if substr(name_a,1,6)= 'عبد ال' then --start
name_a:= 'عبدال'||substr(name_a,7);
end if;
----
name_a := replace(name_a, ' ابن ',' بن '); --middle
if substr(name_a,1,4)='ابن ' then --start
name_a:='بن '||substr(name_a,5);
end if;
if substr(name_a,-4)=' ابن' then --end
name_a:=substr(name_a,1,length(name_a)-4)||' بن';
end if;
-------
我开始在我的 java 类中复制类似的内容。
public class ReplaceSpecialArabicCharacUtil {
/**
* This method is responsible for replacing special arabic
* Characters from the input given to the method. This method
* Algorithm is taken from the database procedure already been
* used for blacklist.
* @param nameInArabic name in Arabic of applicant. E.g First name, last name
* @return
*/
public static String removeSpecialArabicCharacters(String nameInArabic){
//Step-1 Remove multiple spaces. Take the procedure replica from Naveed
nameInArabic = nameInArabic.replaceAll(" ې" ,"ی ");
return nameInArabic;
}
/**
* Driver method responsible for testing the Algorithm.
* It is replicated from the Database Procedure.
* @param args
*/
public static void main(String[] args) throws UnsupportedEncodingException {
String s ="ې ";
// System.out.println(removeSpecialArabicCharacters(s).getBytes("UTF-8"));
}
}
replaceAll 不理解空格。我不确定我是否以正确的方式处理问题。有人可以帮助我,因为我想以正确的方式编写这个实用程序。
谢谢,本
最佳答案
我已尽我所能,使用 Java 代码模仿了您的过程,但 replace_mult_space 除外,我不知道它的作用。
注意:当您复制粘贴时,您肯定会发现编译错误,因为我的 IDE 以及 StackOverflow 并不能很好地支持阿拉伯字符。因此,您必须自己调整代码,直到达到您想要的结果。
这是您的过程的 Java 等效项:
public class ReplaceSpecialArabicCharacUtil {
public static List<Integer> getValidAsciiValues() {
List<Integer> validAsciiValues = new ArrayList<Integer>();
for (int i=193; i<=218; i++) {
validAsciiValues.add(i);
}
for (int i=225; i<=234; i++) {
validAsciiValues.add(i);
}
validAsciiValues.add(32);
validAsciiValues.add(38);
validAsciiValues.add(40);
validAsciiValues.add(41);
validAsciiValues.add(47);
validAsciiValues.add(247);
validAsciiValues.add(248);
validAsciiValues.add(249);
validAsciiValues.add(250);
return validAsciiValues;
}
public static void removeSpecialArabicCharacters(String name_a) {
//replace_mult_spaces(name_a)
int stringLenth = name_a.length();
int pos = 0; //the Java index is 0-based (starts from 0)
while (pos < stringLenth) {
char nextChar = name_a.substring(pos, pos+1).toCharArray()[0];
int asciiValue = (int) nextChar;
if (getValidAsciiValues().contains(asciiValue)) {
pos++;
} else {
throw new AssertionError("The string contains invalid characters");
}
}
name_a = name_a.replaceAll("ې"," ې ");
if (name_a.substring(stringLenth).equals('ي')) {
name_a = name_a.substring(0, stringLenth - 2);
}
name_a = name_a.replaceAll(" ", "ه ");
if (name_a.substring(stringLenth).equals("ة")) {
name_a = name_a.substring(0, stringLenth - 2);
}
name_a = name_a.replace('ا', 'أ');
name_a = name_a.replace('ا', 'إ');
name_a = name_a.replace('ا', 'آ');
name_a = name_a.replace((char) 250, 'ل');
name_a = name_a.replace((char) 247, 'ل');
name_a = name_a.replace((char) 248, 'ل');
name_a = name_a.replace((char) 249, 'ل');
name_a = name_a.replace((char) 63, 'ل');
name_a.replace(' ابن ',' بن ');
if (name_a.substring(0,5).equals("'عبد ال")) {
name_a = name_a.substring(6);
}
name_a.replaceAll(" عبد ال"" " عبدال");
if (name_a.substring(0,3).equals("'ابن"))) {
name_a = name_a.substring(4);
}
if (name_a.substring(-4).equals("ابن))")) {
name_a = name_a.substring(0, name_a.length()-4);
}
}
}
您可以并排比较两者以获得更好的感觉。
关于Java 删除特殊阿拉伯字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24179198/
我以一种特殊的方式收到以下错误。 The point at which the driver is attempting to click on the element was not scrolle
我有一些包含如下方法的编译库: public boolean foo(String userID) { Class ntSystemClass = Thread.currentThread()
假设我有下表 name | genre --------------------- book 1 | scifi book 2 | horror book 3
我正在用代码进行语言翻译。 self.title.text = [NSString stringWithFormat:NSLocalizedString(@"Q%ld", nil), (long)qu
我想这样做,但到目前为止,我所拥有的只是: print("Will you go out with me?") 我希望代码能够正常工作,以便人们可以回答“是/否”,如果回答是"is",则将返回一条消息
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: How can I decode html characters in c#? 我有来自 HTML 的字符,
我想在 JavaScript 中对以下形式的字符串执行 ucwords(),它应该返回 Test1_Test2_Test3。 我已经在 SO 上找到了一个 ucwords 函数,但它只需要空格作为新词
“任何长度的正数表示为数字字符数组,因此介于‘0’和‘9’之间。我们知道最重要的密码位于数组索引 0 的位置。 例子: - 号码是 10282 - 数组将是数字 = [1,0,2,8,2] 考虑到这一
我目前正在开发一个显示特殊 unicode 字符(例如 ꁴ)的应用 现在我遇到了在旧设备上无法显示这些符号的问题。我如何知道它是否适用于当前设备? 我是否必须为每个 SDK 版本创建一个虚拟 Andr
在 HTML、XML 和部分 DTD 中,有两种特殊的标记结构: 以感叹号开头的标签结束,例如 和 以问号开头的标签 ,例如 和 我的问题是,这些构造类型中的每一种是否都有不同的名称,或者我是否必
我目前正在用 python 构建一个 shell。shell 可以执行 python 文件,但我还需要添加使用 PIPE 的选项(例如“|”表示第一个命令的输出将是第二个命令的输入)。 为了做到这一点
我的 MVC 项目中的路由无法正常工作... 我希望我所有的 View 都在 Views > Shared 文件夹中,如下所示: Error.cshtml (default) Index.cshtml
我有一个函数: public static ImageIcon GetIconImageFromResource(String path){ URL url = ARMMain.class.g
好的,所以我想在我的 html 页面中包含下面的字符。看起来很简单,只是我找不到它们的 HTML 编码。 注意:我想在没有大小元素的情况下执行此操作,纯文本就可以了 ^_^。 干杯。 最佳答案 你可以
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 3 年前。
我是 C# 的新手,正在尝试使用 ASP.Net GridView(框架 3.5),当 gridView 文本包含以下内容时,我发现了一个大问题: ñ/Ñ/á/Á/é/É/í/Í/ó/Ó/ú/Ú or
在 Java 中,我尝试编写一个正则表达式来匹配特殊类型的 HTTP URL: http:///# 所以字符串有 4 段: 字符串文字:“http://”;那么 任意 1 个以上字符的字符串;那么 字
当我写查询时,我在表中有“to”列 SELECT to FROM mytable mysql_error 返回错误,如果将单词to插入``引号,即 SELECT `to` FROM mytable 查
我遇到了一个问题。事实上,我使用越南语文本,我想找到每个包含大写字母(大写字母)的单词。当我使用“re”模块时,我的函数 (temp) 没有捕捉到像“Đà”这样的词。另一种方法 (temp2) 是一次
在我的文本中,我想用一个空格替换以下特殊字符: symbols = ["`", "~", "!", "@", "#", "$", "%", "^", "&", "*", "(", ")", "_",
我是一名优秀的程序员,十分优秀!