gpt4 book ai didi

mysql - 如何处理 sqoop 导入分隔符问题\r\n

转载 作者:行者123 更新时间:2023-11-29 01:57:55 25 4
gpt4 key购买 nike

我正在使用 sqoop 从各种来源提取数据,我注意到很多事情都可能出错。我已经多次发生某些列包含分隔符的情况,这些分隔符会导致额外的不需要的行,进而导致不需要的 NULL 值。不需要的字符包括坏人,例如 Windows delmiter\r\n 一直到 Icalandic Thorn。

处理这些问题的最佳做法是什么?

我考虑过按列选择所有内容并使用 REPLACE 类型的方法删除邪恶字符,但感觉应该有更好的方法。

最佳答案

在较新版本的 sqoop 中,您有 --hive_drop-import-delims--hive-delims-replacement 命令。

参见 https://sqoop.apache.org/docs/1.4.3/SqoopUserGuide.html

这将处理字符串字段中的 \r\n\001。对于其他替换,使用 REPLACE 函数的解决方法是可行的方法

关于mysql - 如何处理 sqoop 导入分隔符问题\r\n,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23250977/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com