gpt4 book ai didi

java - 我应该如何通过对相同值的列进行分组来读取 CSV

转载 作者:行者123 更新时间:2023-11-30 02:13:05 25 4
gpt4 key购买 nike

我的任务是读取 CSV 文件,然后执行一些逻辑,然后为此创建一个 JSON。

在创建 JSON 之前,我有点坚持所需的逻辑,我需要针对 SK 设置 Max PR VALUE 作为所有相同 SK 的 PR。

我的要求:

CSV:

SK,VR,ST,PR
1000,1000-Q1,10,187
1000,1000-Q2,20,925 // MAX PR against SK
1001,1001-Q1,10,112
1001,1001-Q2,30,120 // MAX PR against SK

注意:针对 SK 的最大 PR 将始终位于其 SK 的最后一行。

我必须在这里读取 CSV 并需要编写 JSON 数据,如下所示:

[
{
"SK": "1000",
"VR": "1000-Q1",
"ST": "10",
"PR": "925"
},
{
"SK": "1000",
"VR": "1000-Q2",
"ST": "20",
"PR": "925"
},
{
"SK": "1001",
"VR": "1001-Q1",
"ST": "10",
"PR": "120"
},
{
"SK": "1001",
"VR": "1001-Q2",
"ST": "30",
"PR": "120"
}
]

编辑:

代码

       File input = new File("input.csv");
File output = new File("output.json");
CsvSchema csvSchema = CsvSchema.builder().setUseHeader(true).build();
CsvMapper csvMapper = new CsvMapper();

// Read data from CSV file
List<Object> readAll = csvMapper.readerFor(Map.class).with(csvSchema).readValues(input).readAll();

ObjectMapper mapper = new ObjectMapper();

// Write JSON formated data to output.json file
mapper.writerWithDefaultPrettyPrinter().writeValue(output, readAll);

// Write JSON formated data to stdout
System.out.println(mapper.writerWithDefaultPrettyPrinter().writeValueAsString(readAll));

最佳答案

一种方法是首先根据 SK 对 CSV 记录进行分组

        String[] HEADERS = { "SK","VR","ST","PR"};

Reader in = new FileReader("mycsvfile.csv");
Iterable<CSVRecord> records = CSVFormat.DEFAULT
.withHeader(HEADERS)
.withFirstRecordAsHeader()
.parse(in);

// Group the records by SK
Map<String, List<CSVRecord>> recordListBySK = StreamSupport
.stream(records.spliterator(), false).
collect(Collectors.groupingBy(record -> record.get("SK")));

那么这次你需要再添加一个Mapping,它保持每个的MAX-PR每个Sk

 Map<String, Integer> skMaxMap =  recordListBySK
.entrySet()
.stream()
.collect(Collectors
.toMap( e -> e.getKey(),
e -> e.getValue()
.stream()
.mapToInt(v -> Integer.parseInt(v.get("PR")))
.max()
.getAsInt()
)
);

现在您只需构建 json Sk 列表,如下所示:

 // Building the new sk (JSON ) objects
List<NewSk> newSkList = new ArrayList<>();
recordListBySK
.values()
.stream()
.flatMap(v -> v.stream())
.forEach(csvRecord -> {
NewSk newSk = new NewSk(csvRecord.get("SK"),
csvRecord.get("VR"),
csvRecord.get("ST"),
skMaxMap.get(csvRecord.get("SK"))
);
newSkList.add(newSk);
});

如果您尝试打印它们:

newSkList.forEach(sk -> {
System.out.print(" "+sk.getSk());
System.out.print(" "+sk.getVr());
System.out.print(" "+sk.getSt());
System.out.print(" "+sk.getPr());
System.out.println(" ");
});

你会得到这个

 1001 1001-Q1 10 120 
1001 1001-Q2 30 120
1000 1000-Q1 10 925
1000 1000-Q2 20 925

不,您可以使用 JSON 对象映射器将列表写入 JSON 文件。希望对您有帮助

编辑:

public class NewSk {

private String sk;
private String vr;
private String st;
private String pr;

public NewSk(String sk, String vr, String st, String pr) {
this.sk = sk;
this.vr = vr;
this.st = st;
this.pr = pr;
}

public String getSk() {
return sk;
}

public void setSk(String sk) {
this.sk = sk;
}

public String getVr() {
return vr;
}

public void setVr(String vr) {
this.vr = vr;
}

public String getSt() {
return st;
}

public void setSt(String st) {
this.st = st;
}

public String getPr() {
return pr;
}

public void setPr(String pr) {
this.pr = pr;
}

}

关于java - 我应该如何通过对相同值的列进行分组来读取 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49528951/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com