java - 使用 Apache CSVParser 时如何去掉 header 中的额外引号-6ren

java - 使用 Apache CSVParser 时如何去掉 header 中的额外引号

转载作者：搜寻专家更新时间：2023-11-01 02:57:50

25

4

我正在尝试提取 CSV 文件以根据预期值进行验证。但是，标题行中的读取存在问题。具体来说，无论第一列标题是什么，都会被引用，这会混淆映射。

读取文件的方法如下:

public boolean openCsv(File fileObject) {
    if (fileObject.exists()) {
        try {
            parser = CSVParser.parse(fileObject, StandardCharsets.UTF_8, CSVFormat.RFC4180.withFirstRecordAsHeader().withIgnoreHeaderCase());
            headers = parser.getHeaderMap();
            records = parser.getRecords();

            return true;
        } catch (IOException e) {
            System.out.println("Cannot parse CSV file: " + fileObject.getName());
        }
    }
    return false;
}

问题是，对于给定的 header :

"Company ID","Company Name","Company Website","Company Phone", ...

标题映射和记录列表将始终保留引用的第一个值:

Error: IllegalArgumentException-Mapping for Company ID not found, expected one of [Company Name, Company Phone, Company Website, ..., "Company ID"]

我尝试遍历标题并删除引号，但引用的值也是记录映射的一部分，这意味着我必须循环并重建所有内容。

我已经为 CSVParse.parse 尝试了不同的值，但问题仍然存在。

有什么我想念的吗？我检查了 Apache Commons JIRA 板，没有其他人报告过这个问题，所以我倾向于认为这是我需要配置的东西。

由于列因导出而异，我无法对它们进行硬编码并将其传递给解析器。它需要是动态的。

最佳答案

我能够复制类似的问题，如果在引用“公司 ID”之前有空格(但您可能会注意到标题中第一列之前的空格，而且映射中仍会存在空格)。

然后我注意到您的错误消息中还有一件事:“公司 ID”是映射的最后一个打印元素，即使它应该首先使用字母顺序或“在文件中”顺序也是如此。

接下来我想起了unicode中有一些“不可见”的字符。例如:zero width space , (on wikipedia)我在“公司 ID”之前创建了宽度为零的测试文件，并得到了与您在问题中显示的完全相同的错误消息:

Mapping for Company ID not found, expected one of [Company Name, Company Phone, Company Website, "Company ID"] at org.apache.commons.csv.CSVRecord.get(CSVRecord.java:102)

上面的消息中没有分隔符。

顺便说一句，在找到这个之后，我复制了你的错误信息并检查了它是否有不可见字符。似乎有一个 "zero width no break space"在“公司 ID”之前。

可能您必须解析文件并从中删除此类字符 - 我不知道为什么类似的东西会进入 csv 文件。

关于java - 使用 Apache CSVParser 时如何去掉 header 中的额外引号，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48433483/

25

4

0

文章推荐： sockets - TCP 打开套接字延迟

文章推荐： javascript - 在 JSX 中附加元素的惯用方式

文章推荐： Java tcp 套接字没有正确接收

php - 引号(引号)在乌尔都语中造成问题
我有一个类似 ( www.bbcurdu.com) 的网站。现在我的问题是，当我添加一个带有引号或引号的新故事时，它不会保存在数据库中。如果我删除这些逗号或引号，那么它将保存在数据库中。并正确获取和显
ruby - 如何在 Ruby 1.8.7 中将 Microsoft Office "Smart"或 "Curly"引号/撇号转换为 ASCII 或 UTF-8 "Straight"引号/撇号？
我正在使用(并坚持使用)以下版本的 Ruby: ruby 1.8.7 (2012-06-29 patchlevel 370) [x86_64-linux] 我尝试了很多谷歌搜索，但找不到解决我的问题的
Excel连接字符串中的“引号
我有以下示例数据，我想连接 string1 和 string2 以产生连接结果 "a""b" 使用连接函数我在官方的microsoft excel文档中没有找到任何答案 https://suppo
MySQL 引号
我是 SQL-mySQL 方面的 super 新手，我想查询这些包含具有特定值的列的条目，但该值中已经有引号，它实际上看起来像这样，引号已经存在:“荷兰鹿特丹 Voor Land-en Volkenk
正则表达式匹配所有 unicode 引号
是否有一个简单的正则表达式来匹配所有 unicode 引号？还是必须像这样手动编码: quotes = ur"[\"'\u2018\u2019\u201c\u201d]" 感谢阅读。布莱恩最佳答案
javascript - 禁用特殊字符(引号)
我有下面的代码，禁止将特殊字符插入到 HTML 表单上提交的文本中。可以看出，我需要禁用的特殊字符位于引号之间，而我需要禁用引号 " 本身，但我不能这样做，因为如果我添加另一个中间的引号然后读起来就
java - 替换不在括号内的逗号，引号
对于给定的输入字符串 abc,[def,ghi,ijk],lm,(no,pq,rs),[tu,vw,xy],zs,"as,as,fr"输出应该是 abc [def,ghi,ijk] lm (no,pq
Javascript 引号 ... 淡入淡出
下午好，快乐 4 我在处理一些 javascript 时遇到了问题....我是一个初学者，正在使用这个特定的在线示例来了解如何淡入和淡出多个引号... 我已经实现了 HTML/Javascript/C
javascript - 网页上多行文本上的省略号 + 引号
我想在一段文本周围加上引号。文本不能超过 3 行:如果超过，我想要一个省略号(并且我仍然想要引号)。我附上我现在拥有的东西。我的解决方案使用 JS:虽然纯 CSS 解决方案是理想的，但可能的 CSS
随变量帮助一起发送的 php 引号
我将它发送给一个函数，我想在下面的变量值周围加上双引号，例如 $var = "New York"(注意引号) $fq.=" + area:$state"; 所以当我回显 $state 时我想用双
java - 如何在打印的字符串周围添加 ""引号？
这个问题在这里已经有了答案: How can I make Java print quotes, like "Hello"? (11 个答案) 关闭 9 年前。我想在 java 中打印反引号。但是
构造函数中的 F# 引号、数组和自标识符
我认为这是 F# 的一个众所周知的限制，但我找不到任何好的解决方法…… 所以，这里是代码(我试图让它尽可能简单，所以它可能看起来没有任何意义): [] type Human (makeAName: u
php - 如何调用带参数的php url并在SQLite3上的SQL查询中使用它们(引号…)？
我在Windows 7上，在Apache 2.4上使用PHP 5.6.14版：我必须使用PHP在SQLite3数据库上构建查询选择。 NOTA：我是PHP的再见..... 我的代码如下 '; echo
javascript - 令人困惑的 Javascript 引号
在 jQuery 文档中，大多数字符串都是使用单引号“声明”的。包括documentation用于 jQuery UI。那为什么不呢 $(".datepicker").datepicker({ da
Java，在正则表达式中转义(使用)引号
我正在尝试在 Java 中使用以下正则表达式，它应该与任何 lang="2-char-lang-name" 匹配: String lang = "lang=\"" + L.detectLang(inp
restructuredtext - 如何在指令后立即添加 block 引号？
我试图在 more 之后插入一个 block 引用指令，不接受任何参数: First paragraph. .. more:: Blockquote here! -- Author S
java - 使用正则表达式删除 JSON 引号
我从外部进程获得了一些我无法更改的 JSON，并且我需要修改此 JSON 字符串才能使下游 Java 进程正常工作。 JSON 字符串如下所示: {"widgets":"blah","is_dog":
java - 正则表达式处理逗号、双引号、引号
我试图在从数据库读取数据后生成 CSV 文件。现在单个数据可以包含逗号、单引号和双引号。请告诉我如何在正则表达式的帮助下处理这种情况。最佳答案您可以为 CSV 文件使用不同的分隔符吗？也许是一个
java - arg 参数中的代码模型/引号 (")
我尝试在 codemodel(Sun) 中创建下一个表达式: driver.findElement(By.xpath("//div[text()=\""+whatToclick+"\"]/pare
common-lisp - 引号、列表等用时的区别
我需要知道报价和列表之间的区别。例如: cl-prompt> (equal (first (list * 1 2)) *) T cl-prompt> (equal (first '(* 1 2)) *

首页

博学

6Ren·AI

商城

java - 使用 Apache CSVParser 时如何去掉 header 中的额外引号