gpt4 book ai didi

java - XmlResourceParser.getText() 在单引号字符后删除文本,忽略双引号

转载 作者:行者123 更新时间:2023-11-30 10:19:29 25 4
gpt4 key购买 nike

目前正在尝试实现我的 iOS 应用程序的 Android 版本并在解析 XML 时遇到一些问题,其中文本包含单引号或双引号字符(它是外语词典应用程序)。

我的应用程序的所有数据都是从 XML 资源文件加载的。这是该文件的示例:

<entry>
<word>afa'i fā</word>
<definition>See under "afa". Figurative (especially in poetry), king or queen: "hotau afa'i fā".</definition>
</entry>

我通过调用检索 XmlResourceParser:

XmlResourceParser parser = getResources().getXml(R.xml.data);
parse(parser);

这是我的解析代码:

public void parse(XmlResourceParser parser) throws XmlPullParserException, IOException {
int eventType = parser.getEventType();
while (eventType != XmlPullParser.END_DOCUMENT) {
switch (eventType) {
case XmlPullParser.START_TAG:
startTag(parser.getName(), parser);
break;
case XmlPullParser.END_TAG:
endTag(parser.getName(), parser);
break;
case XmlPullParser.TEXT:
foundText(parser.getText());
break;
default:
break;
}
eventType = parser.next();
}
}

当解析文本时,XmlResourceParsergetText() 方法会丢弃 ' 之后的所有内容,并立即从中提取文本的下一个节点。此外,它只是忽略双引号。我的结果如下所示:

(word) 
afa

(definition)
See under afa. Figurative (especially in poetry), king or queen: hotau afa

我已经搜索了文档,但似乎无法在文档中找到任何关于处理单引号和双引号的提及......我唯一能想到的是 XmlResourceParser 没有'我不喜欢文字字符,而是期待实体代码,但我已经尝试将它们换掉,但它仍然忽略了它们。

最佳答案

看起来 getResources().getXml() 返回的 XmlResourceParser 根据文档做了一些额外的事情:

https://developer.android.com/reference/android/content/res/Resources.html#getXml(int)

Return an XmlResourceParser through which you can read a generic XML resource for the given resource ID.

The XmlPullParser implementation returned here has some limited functionality. In particular, you can't change its input, and only high-level parsing events are available (since the document was pre-parsed for you at build time, which involved merging text and stripping comments).

虽然它没有明确说明单引号或双引号,但它显然在对 XML 进行处理。在不更改我的任何代码来解析 XML 的情况下,我通过使用以下内容初始化我自己的 XmlPullParser 来获得所需的输出:

InputStream in = getResources().openRawResource(R.raw.data);
XmlPullParser parser = Xml.newPullParser();
parser.setInput(in, null);
parse(parser);

关于java - XmlResourceParser.getText() 在单引号字符后删除文本,忽略双引号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48605263/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com