gpt4 book ai didi

xml - XmlInputFormat的拆分是否始终包含元素的开始和结束标签?

转载 作者:行者123 更新时间:2023-12-02 21:43:36 24 4
gpt4 key购买 nike

我想知道如何处理具有多个拆分的Xml文件。
谁负责将Xml元素的开始和结束标记放在同一拆分中?
是XmlInputFormat的责任还是在HDFS上创建Xml文件的程序的责任?

最好,
泡菜

最佳答案

XMLInputFormat要求您分别使用xmlinput.startxmlinput.end指定开始标签和结束标签。一旦指定了xml的开始和结束标记,则XMLInputForamt的RecordReader将能够确定记录边界。

作为引用,请看XMLInputFormat的代码。

因此,在HDFS中创建XML文件的程序无需执行任何操作。

关于xml - XmlInputFormat的拆分是否始终包含元素的开始和结束标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26943914/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com