gpt4 book ai didi

windows - 如何使用 Windows 批处理文件从文本文件中提取数字?

转载 作者:可可西里 更新时间:2023-11-01 11:22:43 24 4
gpt4 key购买 nike

我需要使用 cmd(Windows 命令行)执行以下操作。

我有一个名为 DDD.CLI026.WK0933.DDDMR45.001.head 的文件。

文件中的数据如下(一长行)

HEAD HEALTHDMD Weekly  DDD.CLI026 Centocor  W200908021012 
TRAIL0101 000000000581 00000CKSUM00000223680

我需要从 000000000581 中提取 581并将其复制到另一个文件 IMS_FILE_to_LND.par 中,使用 Windows 命令行或 DOS。

我该怎么做?

最佳答案

Irveen,对于输入文件(一行),你可以有以下文件:

infile.txt (the inputfile on one line):
HEAD HEALTHDMD Weekly DDD.CLI026 Centocor W200908021012
TRAIL0101 000000000581 00000CKSUM00000223680

pre.txt (the first half of your desired file):
[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931

post.txt (the second half of your desired file):
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

go.cmd (the command file to create your desired file):
@echo off
setlocal enableextensions enabledelayedexpansion
for /f "tokens=8" %%i in (infile.txt) do (
set num=%%i
:loop1
if "!num!"=="0" goto :skip1
if not "!num:~0,1!"=="0" goto :skip1
set num=!num:~1!
goto :loop1
:skip1
type pre.txt >outfile.txt
echo $$DRM45_RowCount=!num!>>outfile.txt
type post.txt >>outfile.txt
)
endlocal

这会生成文件:

outfile.txt:
[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

我相信这就是您希望从这一系列问题中得到的。

作为解释,for 循环处理您的一行,提取第 8th 字段 (000...00581)。循环跳过部分只是删除前导零,直到你有一个 0 本身或一个实数(Windows 将带有前导零的数字视为八进制,这对我们这里没有好处)。

提取数字后,您只需从前位和后位以及要修改的行构建文件。

我知道,这比我之前提供的 awk 解决方案有点麻烦,但它可以在 Windows 中实现这一点,而无需添加第三方软件(您在其他问题中指出这不是一个选项).

更新 1:这是一个根据要求使用单个模板文件创建输出文件的版本。模板文件必须包含以 "pre:""post:" 开头的行,以指示它们是在要插入的行之前还是之后。根本不使用没有标记的行,因此您可以插入空白行或注释到您的心脏内容。所以你的文件将是:

pre:[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
pre:$$Cust_RowCount=72648
pre:$$Sales_RowCount=5235998
pre:$$OuletChangeLog_RowCount=931

post:$$Control_RowCount=4495
post:$$Outl_Subcat_RowCount=105
post:$$Fac_Subcat_RowCount=149

这是将为您提供所需内容的命令脚本。我只是使用了一个技巧来临时创建前文件和后文件,以尽量减少所需的更改。

@echo off
setlocal enableextensions enabledelayedexpansion
del /q /q pre.txt post.txt >nul: 2>nul:
for /f "delims=" %%j in (template.txt) do (
set ln=%%j
if "!ln:~0,4!"=="pre:" echo !ln:~4!>>pre.txt
if "!ln:~0,5!"=="post:" echo !ln:~5!>>post.txt
)
for /f "tokens=8" %%i in (infile.txt) do (
set num=%%i
:loop1
if not "!num!"=="0" (
if "!num:~0,1!"=="0" (
set num=!num:~1!
goto :loop1
)
)
)
type pre.txt >outfile.txt
echo $$DRM45_RowCount=!num!>>outfile.txt
type post.txt >>outfile.txt
del /q /q pre.txt post.txt >nul: 2>nul:
endlocal

输出:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

就像上面的前/后解决方案一样,但满足您的新要求。

更新 2:如果您可以说服他们采用 Cygwin 解决方案,这就是您所需要的:

x=$(expr 0 + $(awk '{print $8}' infile))
sed "s/^\$\$DRM45_RowCount=.*$/\$\$DRM45_RowCount=$x/" cfgfile >cfgfile_new

cfgfile 包含:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=whatever
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

infile 包含(更短但字段数量相同):

HD HLTHDMD Wkly DDD.CLI Cntcr  W200908021012 TRAIL0101 00581 00000CKSUM680

您将获得以下 cfgfile_new:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

瞧!如此简单。随意使用 cmd 脚本和 Cygwin 脚本来说服您的管理层他们应该使用更好的工具:-)

关于windows - 如何使用 Windows 批处理文件从文本文件中提取数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1426146/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com