gpt4 book ai didi

azure - 如何删除文本文件中引号内而非行尾的\r\n 换行符

转载 作者:行者123 更新时间:2023-12-03 02:50:20 25 4
gpt4 key购买 nike

我有一大堆文件,其中列中包含换行符,这些文件全部用引号引起来,但 U-SQL 无法处理这些文件,因为它将 \r\n 视为尽管用引号括起来,但仍位于行尾。

除了在 Notepad++ 之类的工具中单独打开每个文件之外,是否有一种简单的方法来修复这些文件?如果换行符包含在引号内,似乎应该有一种方法可以忽略换行符。

例子是这样的:
1,200,400,"123 街","123 街,\r\n纽约, NY\r\n美国",\N,\N,200\r\n

Notepad++ 可以很好地手动查找和替换值,但我正在尝试找到一种批处理方法来执行此操作,因为我有多个文件(每个源表 50 个以上),并且每个文件中有数十万条记录修复。

最佳答案

根据 U-SQL GitHub 问题 84:USQL and embedded newline characters您可以构建自定义提取器,或尝试使用内置提取器的 escapeCharacter 参数:

USING Extractors.Csv(quoting : true, escapeCharacter : '\\')//引用默认为 true,但重复也无妨。

关于azure - 如何删除文本文件中引号内而非行尾的\r\n 换行符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56430421/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com