gpt4 book ai didi

使用go实现删除sql里面的注释和字符串功能(demo)

转载 作者:qq735679552 更新时间:2022-09-27 22:32:09 27 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章使用go实现删除sql里面的注释和字符串功能(demo)由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

项目里面有一个需求,要对sql进行简单的语法分析 。

为了避免sql里面的字符串和注释对语法分析做干扰,我写了一个java函数,对sql进行修剪,删除里面字符串和注释,用空格代替 周末闲着没事,我用go重新实现了这个功能,感觉应该会有后来人可以用上 。

说明: sql里面的注释有两种单行注释和多行注释,其中单行注释以--开头,以\n结尾,多行注释以/开头,以/结尾 sql字符串是以'开头,'结尾,但特别的地方是连续两个单引号是代表一个单引号而不是字符串结束标志 。

关键函数如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
`
/**
 
将字节数组里面注释和字符串,用空格替换 rangeBeg和rangeEnd是数组元素起始位置 左闭右开
*/
func TrimSqlByteArray(sql []byte, rangeBeg int, rangeEnd int) []byte {
sqlLength := rangeEnd - rangeBeg - 1;
//删除注释或者字符串后 用空格填充 必免因删除导致粘连改变sql语义
const chPad = ' '
 
//结果切片,预分配空间为入参sql长度一半
result := make([] byte, 0, sqlLength / 2)
 
//本字符类型
var charType int = NORMAL;
for i := rangeBeg; i < rangeEnd; i++ {
/*
*utf8编码不影响判断
//跳过非英文字符
if sql[i] & 0x80 != 0 {
//utf8编码:UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0;
//如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。
//UTF-8最多可用到6个字节。 这里不考虑异常,因为go的字符串基本都是标准utf8编码
i += getPreNotZeroCount(sql[i]) - 1
continue;
}
*/
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
//本字符类型 预设为普通字符
charType = NORMAL
ch := sql[i]
 
//下一个字符
var chNext byte;
chNext = getCharSafe(sql, rangeEnd, i + 1)
 
//非有效sql内容结束位置
endPos := 0
 
if ch == '-' && chNext == '-' {
    //单行注释
    charType = LINE
    //下标移到非有效字符的最后
    endPos = seekToNext(sql, i + 2, rangeEnd, charType)
} else if ch == '/' && chNext == '*' {
    //多行注释
    charType = MULTI
    //下标移到非有效字符的最后
    endPos = seekToNext(sql, i + 2, rangeEnd, charType)
} else if ch == '\'' {
    //字符串
    charType = STRING
    //下标移到非有效字符的最后
    endPos = seekToNext(sql, i + 1, rangeEnd, charType)
}
 
//如果字符是非有效字符 则用空格代替 否则保持原样
if charType == NORMAL {
    result = append(result, ch)
} else {
    result = append(result, chPad)
    i = endPos - 1
}
?
1
2
3
4
5
6
}
 
return result;
}
 
/**

获取字符串或者注释的右边界位置(不包含) 。

?
1
2
3
4
5
6
7
8
9
10
11
rangeEnd是数组边界
*/
func seekToNext(sql []byte, begPos int, rangeEnd int, charType int) int {
 
result := begPos;
 
switch charType {
case MULTI:
for ; result < rangeEnd; result++ {
ch := sql[result]
chNext := getCharSafe(sql, rangeEnd, result+ 1)
?
1
2
3
4
5
6
7
if ch == '*' && chNext == '/' {
         result = result + 1;
         break;
     }
  }
 
  break
?
1
2
3
case LINE:
for ; result < rangeEnd; result++ {
ch := sql[result]
?
1
2
3
4
5
6
if ch == '\n' {
         break;
     }
  }
 
  break
?
1
2
3
4
case STRING:
for ; result < rangeEnd; result++ {
ch := sql[result]
chNext := getCharSafe(sql, rangeEnd, result + 1)
?
1
2
3
4
5
6
7
8
9
10
//sql字符串里面连续的单引号被认为是' 则不是字符串结束标志
     if ch == '\'' && chNext == '\'' {
         result = result + 1;
         continue;
     } else if ch == '\'' {
         break;
     }
  }
 
  break
?
1
2
3
4
5
6
7
8
default:
break;
}
 
result++;
 
return result;
}

完整代码及单元测试已上传 https://github.com/kingstarer/kingstarer.git 。

到此这篇关于使用go实现删除sql里面的注释和字符串功能的文章就介绍到这了,更多相关go删除sql注释和字符串内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我! 。

原文链接:https://www.cnblogs.com/kingstarer/archive/2020/11/29/14058474.html 。

最后此篇关于使用go实现删除sql里面的注释和字符串功能(demo)的文章就讲到这里了,如果你想了解更多关于使用go实现删除sql里面的注释和字符串功能(demo)的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com