- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Python实现判断一行代码是否为注释的方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
目前的编辑器大都可以自动检测某一行代码是否为代码行或注释行,但并不太提供代码行/注释行行数的统计,对于大量代码文件的代码行/注释行统计,就更少见一些。本篇文章试用一段Python脚本来实现这一目标,并希望可以兼容统计不同语言编写的代码.
注释符号的研究 。
我们先来关注常见语言的注释符号构成。一般来讲注释符号分为单行注释符和多行注释符,以Python为例,则分别为#和'''(或""")。由于多行注释符会影响后续行的判断,所以在遍历各行时必须存在一个标志位multiCmtFlagIdx,来记录是否已经开始多行注释,以及多行注释的符号为哪一种。有了该判断之后,才可以继续对后续的字符进行分析.
1. 在多行注释中 。
这种情况后面的分析较为简单,由于已知多行注释符的类型,我们可以判断后续的字符中最早出现对应的多行注释结束符的位置为:
如果可以搜索到,则将multiCmtFlagIdx赋值为-1,表示多行注释已经结束。如果没有搜索到,则说明本行后续字符仍在多行注释中,可以直接开始下一行的解析.
2. 不在多行注释中 。
对于这种情况,如果后续字符中除了空格和制表符,首先出现的是单行注释符,则注释符后面的字符都在注释中,所以可以直接结束本行的解析,开始下一行。否则,我们需要继续搜索多行注释开始符出现的位置.
找到多行注释开始符后,并不意味着后面就是注释内容,还需要做两点检查:
1)该注释符是否在引号对中,因为此时在引号中的注释符是不起作用的; 。
2)该注释符是否是最早出现的多行注释开始符类型,由于同一种语言的多行注释符可能有多种,而只有最早出现的多行注释开始符才起作用.
1)针对第一点,我们可以在搜索的起点到该注释符的区间内计算引号的数量,如果引号为偶数,则说明不在引号对中,否则在引号对中.
引号数量奇偶性判断,需要逐对来判断,这是因为引号对中的引号是不起作用的。有一种特例是,多行注释符同时也是引号的组合,例如Python。此时计算数量的引号,需要与搜索到的多行注释符不同,如多行注释符为''',则应该计算"的数量.
2)针对第二点,我们可以遍历各个多行注释开始符,并取位置最靠前的开始符,然后查找对应的结束符.
代码实现 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
|
\# encoding: utf-8
import re
'''
isCmt
功能:判断一行字符串是否为注释
输入:
line: 字符串行
isInMultiCmt:前面一行是否在多行注释中
qttnFlagList: 引号列表
输出:
isCmt: 当前行是否为注释
isInMultiCmt:当前行是否在多行注释中
'''
def isCmt(line, multiCmtFlagIdx, cmtFlagObj):
singleCmtFlag = cmtFlagObj["singleCmtFlag"] #单行注释符号
multiCmtFlagList =cmtFlagObj["multiCmtFlagList"]
qttnFlagList = cmtFlagObj["qttnFlagList"] #引号列表
startPos = 0 #搜索多行注释符的开始位置
isCmtRet = True
# print 'line: ' + line.strip()
while startPos < len(line): #查找注释符号直到行末
if multiCmtFlagIdx == -1: #不在多行注释中
minStartIdx = len(line) #搜索到最靠前的多行注释符
if singleCmtFlag != '' and re.match(r'(\s)*' + singleCmtFlag, line[startPos:]): #单行注释
break
idx = 0
preStartIdx = startPos #记录搜索多行注释符前的搜索位置
while idx < len(cmtFlagObj["multiCmtFlagList"]):
startCmtFlag = cmtFlagObj["multiCmtFlagList"][idx][0] #多行注释开始符号
if startCmtFlag == '':
return False, -1 #无多行注释符号
try:
startPos = re.search(r'(?<!\\)' + startCmtFlag, line[startPos:]).start() + startPos #找到多行注释开始符号
if isInQuotation(line[:startPos], startCmtFlag, qttnFlagList): #注释开始符在引号中
startPos += len(startCmtFlag.replace('\*', '*')) #找下一个多行注释开始符
continue
else: #注释符号不在引号中
startPos += len(startCmtFlag.replace('\*', '*'))
if startPos < minStartIdx:
multiCmtFlagIdx = idx #是多行注释
minStartIdx = startPos
startPos = preStartIdx #找下一个多行注释开始符
idx += 1
except:
idx += 1
continue #没有找到多行注释开始符,继续查找下个类型的符号
if minStartIdx != len(line): #此时搜索到了多行注释开始符
startCmtFlag = cmtFlagObj["multiCmtFlagList"][multiCmtFlagIdx][0]
if not re.match(r'(\s)*' + startCmtFlag, line[preStartIdx:]):
isCmtRet = False
elif line[preStartIdx:] != '\n':
isCmtRet = False
startPos = minStartIdx
elif multiCmtFlagIdx != -1: #在多行注释中
endCmtFlag = cmtFlagObj["multiCmtFlagList"][multiCmtFlagIdx][1] #多行注释开始符
if endCmtFlag == '':
return False, -1 #注释符号配置有错误
try:
startPos \
= re.search(endCmtFlag, line[startPos:]).start() \
+ startPos \
+ len(endCmtFlag.replace('\*', '*')) #查找多汗注释结束符的位置
multiCmtFlagIdx = -1
except:
break
# print isCmtRet, multiCmtFlagIdx
return isCmtRet, multiCmtFlagIdx #返回是否注释行,以及当前是否在多行注释中
'''
函数名:isInQuotation
功能:根据字符串中引号的奇偶,判断后面的字符是否在引号中
输入:
line: 一行代码中指定字符前的字符串
qttnFlagList: 引号列表
输出:
布尔值:
True:字符串包含在引号中
False:字符串不包含在引号中
'''
def isInQuotation(line, cmtFlag, qttnFlagList):
qttnFlagIdx = len(line)
flagIdx = len(line)
rearLine = line
for i in range(len(qttnFlagList)):
flag = qttnFlagList[i]
if flag == cmtFlag[0]: #排除引号同时也是注释符号的情况
continue
try:
flagIdx = re.search(r'(?<!\\)' + flag + r'.*', line).start() #查找左引号
rearLine = re.search(r'(?<!\\)' + flag + r'.*', line).group()[len(flag):]
except:
flagIdx = len(line)
if flagIdx < qttnFlagIdx: #根据最早出现的左引号,确认左引号类型
qttnFlagIdx = flagIdx
qttnFlag = flag
if qttnFlagIdx != len(line):
try:
#print rearLine
rearLine = re.search(r'(?<!\\)' + qttnFlag + r'.*', rearLine).group()[len(qttnFlag):] #查找右引号
return isInQuotation(rearLine, cmtFlag[0], qttnFlagList) #再次查找下一个左引号
except:
return True #在引号对中
else:
return False #不在引号对中
|
以上这篇Python实现判断一行代码是否为注释的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我.
原文链接:https://blog.csdn.net/Foolishwolf_x/article/details/53242900 。
最后此篇关于Python实现判断一行代码是否为注释的方法的文章就讲到这里了,如果你想了解更多关于Python实现判断一行代码是否为注释的方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我尝试理解[c代码 -> 汇编]代码 void node::Check( data & _data1, vector& _data2) { -> push ebp -> mov ebp,esp ->
我需要在当前表单(代码)的上下文中运行文本文件中的代码。其中一项要求是让代码创建新控件并将其添加到当前窗体。 例如,在Form1.cs中: using System.Windows.Forms; ..
我有此 C++ 代码并将其转换为 C# (.net Framework 4) 代码。有没有人给我一些关于 malloc、free 和 sprintf 方法的提示? int monate = ee; d
我的网络服务器代码有问题 #include #include #include #include #include #include #include int
给定以下 html 代码,将列表中的第三个元素(即“美丽”一词)以斜体显示的 CSS 代码是什么?当然,我可以给这个元素一个 id 或一个 class,但 html 代码必须保持不变。谢谢
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
我试图制作一个宏来避免重复代码和注释。 我试过这个: #define GrowOnPage(any Page, any Component) Component.Width := Page.Surfa
我正在尝试将我的旧 C++ 代码“翻译”成头条新闻所暗示的 C# 代码。问题是我是 C# 中的新手,并不是所有的东西都像 C++ 中那样。在 C++ 中这些解决方案运行良好,但在 C# 中只是不能。我
在 Windows 10 上工作,R 语言的格式化程序似乎没有在 Visual Studio Code 中完成它的工作。我试过R support for Visual Studio Code和 R-T
我正在处理一些报告(计数),我必须获取不同参数的计数。非常简单但乏味。 一个参数的示例查询: qCountsEmployee = ( "select count(*) from %s wher
最近几天我尝试从 d00m 调试网络错误。我开始用尽想法/线索,我希望其他 SO 用户拥有可能有用的宝贵经验。我希望能够提供所有相关信息,但我个人无法控制服务器环境。 整个事情始于用户注意到我们应用程
我有一个 app.js 文件,其中包含如下 dojo amd 模式代码: require(["dojo/dom", ..], function(dom){ dom.byId('someId').i
我对“-gencode”语句中的“code=sm_X”选项有点困惑。 一个例子:NVCC 编译器选项有什么作用 -gencode arch=compute_13,code=sm_13 嵌入库中? 只有
我为我的表格使用 X-editable 框架。 但是我有一些问题。 $(document).ready(function() { $('.access').editable({
我一直在通过本教程学习 flask/python http://blog.miguelgrinberg.com/post/the-flask-mega-tutorial-part-i-hello-wo
我想将 Vim 和 EMACS 用于 CNC、G 代码和 M 代码。 Vim 或 EMACS 是否有任何语法或模式来处理这种类型的代码? 最佳答案 一些快速搜索使我找到了 this vim 和 thi
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve this
这个问题在这里已经有了答案: Enabling markdown highlighting in Vim (5 个回答) 6年前关闭。 当我在 Vim 中编辑包含 Markdown 代码的 READM
我正在 Swift3 iOS 中开发视频应用程序。基本上我必须将视频 Assets 和音频与淡入淡出效果合并为一个并将其保存到 iPhone 画廊。为此,我使用以下方法: private func d
pipeline { agent any stages { stage('Build') { steps { e
我是一名优秀的程序员,十分优秀!