- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试创建一个批处理文件,该文件将编辑 .csv 并删除第一列以及文件中包含的所有摘要行。然而,我对编程批处理文件还很陌生,所以我不确定开始这个的最佳方法,如果你能包括一个代码如何工作的基本解释,那就太好了,这样我就可以在未来!
,Type,Date,Num,Name,Memo,Member,Clr,Split,Alias,Value,Balance
ABB - Egypt,,,,,,,,,,,
ElAin EL-Sokhna,,,,,,,,,,,
,Invoice,09-06-10,12005,ABB - EL-Sokhna,,Accounts Receivable,,Training Income,15000,,15000
,Invoice,09-14-11,12005,ABB - EL-Sokhna,“ElAin EL-Sokhna“ Trainer for OTS Application: First two weeks,Training Income,,Accounts,,150001,0
Total ElAin EL-Sokhna,,,,,,,,,241194,210400,301794
ABB - Egypt - Other,,,,,,,,,,,
此文件有多个版本,因为它们来自月度报告,我需要删除第一个(空)列,以及任何看起来像 ABB - Egypt,,,,,,,, ,,,
或 总 ElAin EL-Sokhna,,,,,,,,241194,210400,301794
所以输出应该是:
Type,Date,Num,Name,Memo,Member,Clr,Split,Alias,Value,Balance
Invoice,09-06-10,12005,ABB - EL-Sokhna,,Accounts,,Training Income,15000,,15000
Invoice,09-14-11,13002,ABB - EL-Sokhna,“ElAin EL-Sokhna“ Trainer for OTS Application: First two weeks,Training Income,,Accounts,,150001,0
感谢您的输入!
编辑:看来我在我的 OP 中还不够清楚(抱歉,第一次来这里)。
这里有两个过程需要进行,在每个文件中,第一列必须被删除,以及标题行 ABB - Egypt,,,,,,,,,,,
或摘要行 Total ElAin EL-Sokhna,,,,,,,,,241194,210400,301794
需要删除。
所有需要保留的行都会被大部分填充,比如,Type,Date,Num,Name,Memo,Member,Clr,Split,Alias,Value,Balance
或 ,Invoice,09-06-10,12005,ABB - EL-Sokhna,,Accounts Receivable,,Training Income,15000,,15000
请注意,如第二行所示,它们中可能存在一些缺失值,因此搜索“,,”之类的内容将不起作用。
最佳答案
批处理是一种用于修改文本文件的糟糕语言。有很多特殊情况需要神秘的知识来解决问题。您可能有一个脚本似乎可以满足您的要求,然后您的数据中出现了一些问题,整个脚本可能需要重新设计。
关于您的具体问题,在我看来您只想保留以逗号开头的行,这意味着第一列是空的。在那些剩余的行中,您想要删除第一列(空列)。
假设您要保留的所有行的第二列都没有空值,那么有一个非常简单的解决方案:
@echo off
>"%~1.new" (for /f "delims=, tokens=*" %%A in ('findstr "^," %1') do echo %%A)
move /y "%~1.new" %1 >nul
脚本期望文件作为第一个也是唯一的参数传递。因此,如果您的脚本名为“fixCSV.bat”,而要修改的文件是“c:\test\file.csv”,那么您将使用:
fixCSV "c:\test\file.csv"
%1
扩展为第一个参数的值,%~1
是相同的,除了它还去掉了可能是也可能不是的任何封闭引号目前。
FINDSTR 命令读取文件并只写出以逗号开头的行。 FOR/F 命令迭代每一行输出。 “delims=, tokens=*”选项有效地从每一行中去除所有前导逗号,结果在变量 %%A
中,然后被 ECHO。整个构造包含在括号中,标准输出被重定向到一个临时文件。最后,临时文件被移动到原始文件之上,从而替换它。
如果第 2 列可能为空,则结果将被破坏,因为它删除了所有前导逗号(在本例中为第 1 列和第 2 列)。脚本必须更复杂才能弥补。您需要设置一个变量,然后使用延迟扩展来获取子字符串,跳过第一个字符。但是延迟扩展会破坏 %%A 变量的扩展,如果它包含 !
字符。所以必须打开和关闭延迟扩展。您开始明白我所说的许多特殊情况的意思。
@echo off
setlocal disableDelayedExpansion
>"%~1.new" (
for /f "delims=" %%A in ('findstr "^," %1') do (
set "ln=%%A"
setlocal enableDelayedExpansion
echo !ln:~1!
endlocal
)
)
move /y "%~1.new" %1 >nul
随着批处理脚本变得越来越复杂,它们变得越来越慢。对于大多数文件来说,这可能不是问题,但如果文件非常大(比如数百兆字节),那么它可能会成为问题。
我几乎再也不用纯批处理来修改文本文件了。相反,我使用我编写的名为 JREPL.BAT 的混合 JScript/批处理实用程序.该实用程序是纯脚本,可以在 XP 及更高版本的任何 Windows 机器上本地运行。 JREPL.BAT 能够使用正则表达式替换来高效地修改文本文件。正则表达式可能看起来很神秘,但非常值得学习。
假设您的 PATH 中某处有 JREPL.BAT,那么您只需要以下命令:
jrepl "^,(.*)" "$1" /jmatch /f "yourFile.csv" /o -
/F 选项指定要读取的文件。
值为 -
的/O 选项指定输出应替换原始文件。
/JMATCH 选项指定将每个替换值写出到一个新行。所有其他文本都被删除。
第一个参数是搜索表达式。它匹配以逗号开头的任何行,之后的所有内容都被捕获在名为 $1 的变量中。
第二个参数指定替换值,它只是变量 $1 中捕获的值。
关于batch-file - 通过批处理从 csv 文件中删除一些列和行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28079306/
猫f1.txt阿曼维沙尔阿杰贾伊维杰拉胡尔曼尼什肖比特批评塔夫林现在输出应该符合上面给定的条件 最佳答案 您可以在文件读取循环中设置一个计数器并打印它, 计数=0 读取行时做 让我们数一数++ if
我正在尝试查找文件 1 和文件 2 中的共同行。如果公共(public)行存在,我想写入文件 2 中的行,否则打印文件 1 中的非公共(public)行。fin1 和 fin2 是这里的文件句柄。它读
我有这个 SQL 脚本: CREATE TABLE `table_1` ( `IDTable_1` int(11) NOT NULL, PRIMARY KEY (`IDTable_1`) );
我有 512 行要插入到数据库中。我想知道提交多个插入内容是否比提交一个大插入内容有任何优势。例如 1x 512 行插入 -- INSERT INTO mydb.mytable (id, phonen
如何从用户中选择user_id,SUB(row, row - 1),其中user_id=@userid我的表用户,id 为 1、3、4、10、11、23...(不是++) --id---------u
我曾尝试四处寻找解决此问题的最佳方法,但我找不到此类问题的任何先前示例。 我正在构建一个基于超本地化的互联网购物中心,该区域分为大约 3000 个区域。每个区域包含大约 300 个项目。它们是相似的项
preg_match('|phpVersion = (.*)\n|',$wampConfFileContents,$result); $phpVersion = str_replace('"','',
我正在尝试创建一个正则表达式,使用“搜索并替换全部”删除 200 个 txt 文件的第一行和最后 10 行 我尝试 (\s*^(\h*\S.*)){10} 删除包含的前 10 行空白,但效果不佳。 最
下面的代码从数据库中获取我需要的信息,但没有打印出所有信息。首先,我知道它从表中获取了所有正确的信息,因为我已经在 sql Developer 中尝试过查询。 public static void m
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我试图在两个表中插入记录,但出现异常。您能帮我解决这个问题吗? 首先我尝试了下面的代码。 await _testRepository.InsertAsync(test); await _xyzRepo
这个基本的 bootstrap CSS 显示 1 行 4 列: Text Text Text
如果我想从表中检索前 10 行,我将使用以下代码: SELECT * FROM Persons LIMIT 10 我想知道的是如何检索前 10 个结果之后的 10 个结果。 如果我在下面执行这段代码,
今天我开始使用 JexcelApi 并遇到了这个:当您尝试从特定位置获取元素时,不是像您通常期望的那样使用sheet.getCell(row,col),而是使用sheet.getCell(col,ro
我正在尝试在我的网站上开发一个用户个人资料系统,其中包含用户之前发布的 3 个帖子。我可以让它选择前 3 条记录,但它只会显示其中一条。我是不是因为凌晨 2 点就想编码而变得愚蠢? query($q)
我在互联网上寻找答案,但找不到任何答案。 (我可能问错了?)我有一个看起来像这样的表: 我一直在使用查询: SELECT title, date, SUM(money) FROM payments W
我有以下查询,我想从数据库中获取 100 个项目,但 host_id 多次出现在 urls 表中,我想每个 host_id 从该表中最多获取 10 个唯一行。 select * from urls j
我的数据库表中有超过 500 行具有特定日期。 查询特定日期的行。 select * from msgtable where cdate='18/07/2012' 这将返回 500 行。 如何逐行查询
我想使用 sed 从某一行开始打印 n 行、跳过 n 行、打印 n 行等,直到文本文件结束。例如在第 4 行声明,打印 5-9,跳过 10-14,打印 15-19 等 来自文件 1 2 3 4 5 6
我目前正在执行验证过程来检查用户的旧密码,但问题是我无法理解为什么我的查询返回零行,而预期它有 1 行。另一件事是,即使我不将密码文本转换为 md5,哈希密码仍然得到正确的答案,但我不知道为什么会发生
我是一名优秀的程序员,十分优秀!