gpt4 book ai didi

python - Unix 排序产生错误的输出

转载 作者:可可西里 更新时间:2023-11-01 16:22:57 26 4
gpt4 key购买 nike

我正在尝试通过执行以下操作来测试 hadoop 流作业的映射器和缩减器功能:

    cat data.txt | python mapper.py | sort | python reducer.py

但是映射器的排序输出不正确。

he the  1
i 1
i dog 1
i like 1
i'm 1
i'm rob 1
i'm the 1
i the 1 ### this should be after "i like 1" ###
lazy 1

我让其他人在他们的机器上进行测试,他们使用完全相同的映射器函数和命令行执行获得了正确的输出。所以我的 Unix 排序似乎出了问题。

如果这有帮助:

echo $TERM
> vt100

对于尝试或设置不同的内容的任何建议将不胜感激。谢谢

最佳答案

你有你的答案here这是关于语言环境的。简而言之,你应该使用

cat data.txt | python mapper.py | LC_COLLATE=C sort

关于python - Unix 排序产生错误的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22795320/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com