gpt4 book ai didi

windows - 合并 csv 会破坏变音字符

转载 作者:可可西里 更新时间:2023-11-01 10:33:07 26 4
gpt4 key购买 nike

我正在尝试合并一些 csv 文件。我在 Windows 上使用 cmd 执行此操作,例如 type *.csv >> 或使用批处理文件,其中包含

echo. > all.csv
for %%a in (*.csv) DO copy /b alle.csv+%%a all.csv

在一台计算机(win7x64)上合并没问题。但是在另一个(相同的 win7x64)上,所有变音字符(德语:äüöß)都被破坏了 - 而不是它们只有 ´,,´。

应该合并的源文件具有健康的变音字符 - 我用 Notepad++ 和 Excel 打开它们,作为 ANSI 或 Unicode - 一切正常。

如何调整文件合并以保存变音符号?

最佳答案

我认为有几个问题导致了意想不到的结果:

  1. 您尝试通过 echo 创建一个空文件。 > all.csv,但这实际上导致文件包含一个 SPACE,后跟一个换行符 (CR + LF), ANSI 编码。因此,您可能拥有不同编码的文件,这可能会导致麻烦。

    要真正创建一个空文件,使用rem/> all.csvbreak > all.csvtype nul > all.csvcopy/Y nul all.csv

  2. 使用copy 合并文件时,如果目标文件也是源文件之一,则可能会出现问题。当它是第一个源文件时,附加所有其他源文件的数据;当它不是第一个源文件时,可能会出现覆盖提示(除非您指定/Y)并且数据可能会丢失。由于您将 *.csv 作为源文件,我们实际上并不知道首先枚举哪个源文件,因此它可能是也可能不是 all.csv。所以为了避免这样的麻烦,你最好在复制之前删除目标文件,而不是创建一个空文件,比如del all.csv

  3. 假设您有 Unicode 文件,它们以两个字节的 header 0xFF + 0xFE 开头。使用 copy/B 组合此类文件时,文件中有多个此类 header 。要克服这个问题,请执行 copy/A 但在 cmd/U 启动的 Unicode cmd 实例中:

     cmd /U /C del all.csv ^& copy /A *.csv all.csv

关于windows - 合并 csv 会破坏变音字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42806613/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com