gpt4 book ai didi

Windows 批处理文件 : Convert Structures into Single Lines Strings

转载 作者:可可西里 更新时间:2023-11-01 09:19:31 25 4
gpt4 key购买 nike

这个艰巨的任务我需要作为一个批处理文件来完成,它不是最难用 C 做的,但在 DOS 中是一个 hell (至少对我来说!)我需要将一个结构转换为单个 var(字符串)能够在我的程序中再次将它们转换为该结构。不要担心卷土重来,它已经完成了。

该结构的大小会有所不同,并且在 [0] 内有一个索引,它需要成为我的 var 中的第一项。

这里是这些结构的一个例子(只有 3 个):

level.waypoints[0] = spawnstruct();
level.waypoints[0].origin = (1774.5,834.7,67.6);
level.waypoints[0].type = "stand";
level.waypoints[0].childCount = 2;
level.waypoints[0].children[0] = 1;
level.waypoints[0].children[1] = 6;
level.waypoints[1] = spawnstruct();
level.waypoints[1].origin = (1780.6,639.1,65.5);
level.waypoints[1].type = "stand";
level.waypoints[1].childCount = 2;
level.waypoints[1].children[0] = 7;
level.waypoints[1].children[1] = 0;
level.waypoints[2] = spawnstruct();
level.waypoints[2].origin = (1902.2,-345.2,74.2);
level.waypoints[2].type = "stand";
level.waypoints[2].childCount = 2;
level.waypoints[2].children[0] = 3;
level.waypoints[2].children[1] = 97;
level.waypoints[3] = spawnstruct();
level.waypoints[3].origin = ... (goes on...)

所以第一个结构:

level.waypoints[0] = spawnstruct();
level.waypoints[0].origin = (1774.5,834.7,67.6);
level.waypoints[0].type = "stand";
level.waypoints[0].childCount = 2;
level.waypoints[0].children[0] = 1;
level.waypoints[0].children[1] = 6;

我需要将这个结构转换成这一行:

set flwp_0 "0,1774.5,834.7,67.6,stand,2,1,6"

其中 0 (flwp_) 是索引,也是 ""中的第一项。

所以这个例子中的另外两个是:

set flwp_1 "1,1780.6,639.1,65.5,3,7,0,30"
set flwp_2 "2,1902.2,-345.2,74.2,2,3,97"

childCount 可以是任何值,但我认为不会超过 9。所以,我们有多少个 childCount,下一行就会有更多的 child 。

但我只需要 childCount 值之后的值,所以我根据该值知道该字符串中还有多少项目可用,所以没问题。

我正在考虑首先删除我不需要的所有内容,例如(按顺序):

level.waypoints[
] = spawnstruct();
].origin = (
);
].type = "
";
].childCount =
].children[0] =
].children[1] =
].children[2] =
].children[3] =
].children[4] =
].children[5] =
].children[6] =
].children[7] =
].children[8] =
].children[9] =
;

这将在第一个结构中留下类似这样的内容:

0
01774.5,834.7,67.6
0stand
02
01
06

现在我需要读取它并将其转换为我的单行字符串。但是我在知道正确的索引时遇到问题,因为它可能是第一个值,但如果索引有 2 个或 3 个字符?

我也想用一些信息替换来跟踪我,所以不会替换文件的“]”,所以我会知道它之前是索引,之后是值。

我也曾尝试循环但没有成功创建索引,例如:

level.waypoints[X]

其中 X 是从 0 到 1000(我不相信会传递那个数字)

它不起作用,也许我的第一个想法更好...:\

我需要一个(或多个)批处理文件来将几个具有类似结构的文件转换为新文件,并将值作为我在上面详细写的字符串。

有什么想法吗?

谢谢!


@Squashman 另外,如您所见,结果的顺序有点困惑:

set flwp_0 "0,1774.5,834.7,67.6,stand,2,1,6"
set flwp_100 "100,1636.76,371.924,240.125,stand,2,101,99"
set flwp_101 "101,1861.45,437.846,240.125,stand,2,102,100"
set flwp_102 "102,1843.93,557.03,240.125,stand,2,103,101"
set flwp_103 "103,1504.58,553.357,64.125,stand,2,8,102"
set flwp_104 "104,653.17,1675.32,64.125,stand,2,26,105"
set flwp_105 "105,338.784,1680.49,232.125,stand,2,104,133"
set flwp_106 "106,-919.398,1537.7,80.125,stand,3,107,109,150"
set flwp_107 "107,-928.311,1111.47,80.125,stand,3,108,106,149"
set flwp_108 "108,-696.488,1095.93,80.125,stand,2,36,107"
set flwp_109 "109,-787.781,1566.87,80.125,stand,2,106,110"
set flwp_10 "10,1423.3,-403.8,64.3,stand,4,11,12,15,3"
set flwp_110 "110,-754.274,1716.71,80.125,stand,2,109,34"
set flwp_111 "111,-736.201,1887.87,64.125,stand,4,112,34,151,152"
set flwp_112 "112,-454.293,1879.4,64.125,stand,4,111,33,34,152"
set flwp_113 "113,125.395,-451.579,58.6958,stand,3,51,114,142"
set flwp_114 "114,282.593,-447.87,68.125,stand,2,115,113"
set flwp_115 "115,304.311,-271.206,68.125,stand,2,116,114"
set flwp_116 "116,447.128,-292.167,68.125,stand,3,118,115,117"
set flwp_117 "117,437.415,-443.822,68.125,stand,2,67,116"
set flwp_118 "118,582.932,-297.811,126.125,stand,2,119,116"
set flwp_119 "119,561.586,-485.701,204.125,stand,2,120,118"
set flwp_11 "11,1240.1,-249.7,74.1,stand,5,9,16,10,12,15"
set flwp_120 "120,423.422,-470.754,204.125,stand,2,119,135"
set flwp_121 "121,1164.82,-1203.64,72.125,stand,4,123,14,126,122"
set flwp_122 "122,1064.12,-1299.76,72.125,stand,3,123,125,121"
set flwp_123 "123,1117.59,-1476.49,72.125,stand,3,124,122,121"
set flwp_124 "124,861.878,-1497.7,72.125,stand,2,125,123"
set flwp_125 "125,878.58,-1294.38,72.125,stand,2,124,122"

是否可以按正确的顺序写入文件?

再次非常感谢@Squashman 的帮助

干杯


好吧,顺序真的不重要,但是我很难把每个文件都做成一个新文件......我试过了但没有成功:

@echo off
setlocal enabledelayedexpansion

for %%f in (*.gsc) do (

FOR /F "tokens=1-2 delims==;^(^) " %%G IN (%%f) do set %%~G=%%~H
FOR /F "tokens=2 delims=[]" %%G IN ('set level.waypoints ^|find /I "spawnstruct"') do (
SET waypoints=!waypoints! %%G
)

FOR %%G IN (%waypoints%) do (
set line=%%G,!level.waypoints[%%G].origin!,!level.waypoints[%%G].type!,!level.waypoints[%%G].childCount!
FOR /F "tokens=2 delims==" %%H IN ('set level.waypoints[%%G].children') DO set line=!line!,%%H
set line=set flwp_%%G "!line!"
echo !line! >> %%f.cfg
)

)
pause

有什么线索吗?

=======================================

好的,现在我们非常接近了!只需要处理带有 level.waypoints[ 的行,其余的必须忽略,并且还要添加一个我已经在下面成功完成的最终关闭变量:

@echo off
setlocal enableDelayedExpansion

set findtext="level.waypoints["
for %%F in (*.gsc) do (
set "out="
set "i=x"
> "%%~nF.cfg" (
for /f usebackq^ tokens^=2^,4^,5^ delims^=[]^=(^)^;^"^ %%A in ("%%F") do (
if %%A neq !i! (
if defined out echo !out!"
set /a "i=%%A, j=0"
set "out=set flwp_!i! "!i!"

) else (
set /a j+=1
if !j! leq 3 (set "out=!out!,%%B") else set "out=!out!,%%C"
)

)
if defined out echo !out!"
set /a "fim=i+1"
echo set flwp_!fim! "eof"
)
)

现在如何将 findstr %findtext% 添加到这些循环中?我尝试了很多不同的方法,但语法错误......你能帮我吗? :D

非常感谢@Squashman 和@dbenham 迄今为止提供的所有帮助。

干杯

最佳答案

这是一个相对快速的纯批处理解决方案,它对每个文件使用单个 FOR/F 循环。它明显快于 Squashman's solution .

我设置 DELIMS 和 TOKENS 来解析所有需要的数据元素,无论我解析的是哪一行。我不担心 childCount 的值。相反,我只是检测航点索引的变化以表示新记录的开始,并使用递增的航点行号(j 变量)来识别每行需要哪些标记。每行向 out 变量添加新文本。

@echo off
setlocal enableDelayedExpansion
for %%F in (*.gsc) do (
set "out="
set "i=x"
> "%%~nF.cfg" (
for /f usebackq^ tokens^=2^,4^,5^ delims^=[]^=(^)^;^"^ %%A in ("%%F") do (
if %%A neq !i! (
if defined out echo !out!"
set /a "i=%%A, j=0"
set "out=set flwp_!i! "!i!"
) else (
set /a j+=1
if !j! leq 3 (set "out=!out!,%%B") else set "out=!out!,%%C"
)
)
if defined out echo !out!"
)
)

上面的代码能够在 70 秒内在我的机器上处理一个 23 MB 的文件。


但如果你允许自己超出纯批处理的范围,我可以做得更好。这是一个高效的 JREPL.BAT利用刚刚发布的新版本 6.0 功能的解决方案。

JREPL.BAT is a regular expression text processing utility for Windows .它是纯脚本(混合批处理/Jscript),可以在从 XP 开始的任何 Windows 机器上本地运行。不需要第 3 方 exe 文件。

通过 jrepl/?jrepl/?? 可从命令行获得大量文档以获取分页帮助。

此解决方案应该能够处理大小接近 1 GB 的文件。每个文件都通过一次调用 JREPL.BAT 来完全处理。它应该非常有效,因为需要的回溯最少。对于小文件,由于 CSCRIPT 引擎的启动时间,它会比纯批处理方法慢。但对于大文件,它比纯批处理要快得多。

下面的代码只用了 11 秒就处理了同一个 23 MB 的文件:-)

第一个版本将复杂的正则表达式术语的构造分解为多个步骤,并在每个捕获的组上方包含注释数字,让您有机会了解其工作原理。特别是阅读/T 和/P 选项的文档。还要加强您的正则表达式技能!

@echo off
setlocal

set "filter=(.*?\[\d+])[\s\S]*?(?:\n(?!\1)|(?![\s\S]))"

:: 1 2 3 4
set "find1=l.*?\[(\d+)\][\s\S]*?\((\d.*?)\)[\s\S]*?\q(.*?)\q"
set "repl1=set flwp_$2 \q$2,$3,$4"

:: 5 6
set "find2=;[\s\S]*? = (\d+)"
set "repl2=,$6"

:: 7
set "find3=[\s\S]+"
set "repl3=\q\n"

set "find=%find1%|%find2%|%find3%"
set "repl=%repl1%|%repl2%|%repl3%"

for %%F in (*.gsc) do (
call jrepl.bat "%find%" "%repl%" /t "|" /p "%filter%" /x /m /f "%%F" /o "%%~nF.cfg"
)

这里是完全相同的解决方案,但没有显示任何中间步骤。我确实包含了行延续以提高可读性。

@echo off
for %%F in (*.gsc) do (
call jrepl.bat "l.*?\[(\d+)\][\s\S]*?\((\d.*?)\)[\s\S]*?\q(.*?)\q|;[\s\S]*? = (\d+)|[\s\S]+"^
"set flwp_$2 \q$2,$3,$4|,$6|\q\n"^
/p "(.*?\[\d+])[\s\S]*?(?:\n(?!\1)|(?![\s\S]))"^
/t "|" /x /m /f "%%F" /o "%%~nF.cfg"
)

我认为最快的脚本解决方案是自定义构建的 JScript 或 VBS 脚本。但我喜欢使用 JREPL :-)

更新:这里有一个小奖励 - 一个 JREPL 脚本,可以将 *.cfg 转换回 *.gsc

@echo off
setlocal

set "beg=var pre,i,q='\x22',n='\r\n'"

:: 1 2 3 4 5 67
set "find=^.*?\q(\d+),(.*?,.*?,.*?),(.*?),(.*?),|(.*?)[,\q]"

set "repl=i=0;pre='level.waypoints['+$2+']';$txt=pre+' = spawnstruct();'"
set "repl=%repl%+n+pre+'.origin = ('+$3+');'"
set "repl=%repl%+n+pre+'.type = '+q+$4+q+';'"
set "repl=%repl%+n+pre+'.childCount = '+$5+';'"
set "repl=%repl%|$txt=n+pre+'.children['+(i++)+'] = '+$7+';'"

for %%F in (*.cfg) do (
call jrepl.bat "%find%" "%repl%" /x /t "|" /jq /jbeg "%beg%" /f "%%F" /o "%%~nF.gsc"
)

关于Windows 批处理文件 : Convert Structures into Single Lines Strings,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39882733/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com