gpt4 book ai didi

java - 使用 Univocity CSV 解析器解析具有相同定义但列数不同的两个不同文件

转载 作者:行者123 更新时间:2023-11-30 08:34:08 26 4
gpt4 key购买 nike

我正在使用 Univocity 解析器解析 CSV 文件并将它们填充到 Bean 中。

我面临的问题是我有两个不同的文件。这两个文件的结构相同,但列数不同。它们都引用相同的 Bean 类。

例如:

File A contains(without header):
I|123|Hello
U|345|Hi

File B contains(without header):
123|Hello
345|Hi

Bean 类的定义是:

public class Bean {
@Trim
@Parsed(index = 0)
protected String action;

@Trim
@Parsed(index = 1)
protected Long id;

@Trim
@Parsed(index = 2)
protected String name;

......................
}

如果我对两个文件使用相同的 bean,则它期望两个文件中的列数相同,但它失败了。

我认为我可以使用的另一种方法是为不同的文件集使用两个不同的 bean,但我正在寻找 Univocity 解析器中是否有任何功能来处理这种情况。

请帮忙。谢谢。

最佳答案

您可以在解析每个输入之前“手动”设置 header 。例如:

    CsvParserSettings s = new CsvParserSettings();
s.setHeaderExtractionEnabled(false);
CsvRoutines r = new CsvRoutines(s);

//set headers of input with 3 columns
s.setHeaders("action" , "id", "name");
for(Bean b : r.iterate(Bean.class, new StringReader("I,123,Hello\nU,345,Hi"))){
System.out.println(b);
}

//set headers of input with 2 columns
s.setHeaders("id", "name");
for(Bean b : r.iterate(Bean.class, new StringReader("123,Hello\n345,Hi"))){
System.out.println(b);
}

如果您将 bean 更改为使用标题名称而不是列位置,以上内容将起作用:

public class Bean {
@Trim
@Parsed
protected String action;

@Trim
@Parsed
protected Long id;

@Trim
@Parsed
protected String name;

我得到了以下输出(在将 toString() 方法添加到 Bean 类之后):

Bean{action='I', id=123, name='Hello'}
Bean{action='U', id=345, name='Hi'}
Bean{action='null', id=123, name='Hello'}
Bean{action='null', id=345, name='Hi'}

希望这对您有所帮助!

关于java - 使用 Univocity CSV 解析器解析具有相同定义但列数不同的两个不同文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39041315/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com