gpt4 book ai didi

python - 在第一个逗号出现的地方拆分超过 10 个单词的行/句子

转载 作者:太空宇宙 更新时间:2023-11-04 09:24:51 28 4
gpt4 key购买 nike

我有以下代码,每 10 个单词拆分一行。

    #!/bin/bash

while read line
do
counter=1;
for word in $line
do
echo -n $word" ";
if (($counter % 10 == 0))
then
echo "";
fi
let counter=counter+1;
done
done < input.txt

问题是分割点是第10个字。相反,我希望分割点是第一个逗号字符(仅适用于超过 10 个单词的句子)。

例子:

line1: 测试行的短语,我想拆分,但我不知道如何拆分。

第 1 行:来自测试行的短语,line2: 我想拆分,但我不知道如何拆分。

如果没有找到逗号字符,则简单地返回该行。

谢谢!

编辑:Python 或 Bash 解决方案将起作用。

最佳答案

更好的方法是使用 awk 并测试 15 个或更多单词,如果是这样,只需将 ",\n" 替换为 ", ",例如

awk 'NF >= 15 {sub (", ", ",\n")}1' file

示例使用/输出

file 中输入,您将拥有:

$ awk 'NF >= 15 {sub (", ", ",\n")}1' file
phrase from a test line,
which I want to split, and I don't know how.

(如果你有大量行,awk 将比 shell 循环快几个数量级)

关于python - 在第一个逗号出现的地方拆分超过 10 个单词的行/句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58240415/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com