- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章详解Python最长公共子串和最长公共子序列的实现由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
最长公共子串(The Longest Common Substring) 。
LCS问题就是求两个字符串最长公共子串的问题。解法就是用一个矩阵来记录两个字符串中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。然后求出对角线最长的1的序列,其对应的位置就是最长匹配子串的位置.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
def
find_lcsubstr(s1, s2):
m
=
[[
0
for
i
in
range
(
len
(s2)
+
1
)]
for
j
in
range
(
len
(s1)
+
1
)]
#生成0矩阵,为方便后续计算,比字符串长度多了一列
mmax
=
0
#最长匹配的长度
p
=
0
#最长匹配对应在s1中的最后一位
for
i
in
range
(
len
(s1)):
for
j
in
range
(
len
(s2)):
if
s1[i]
=
=
s2[j]:
m[i
+
1
][j
+
1
]
=
m[i][j]
+
1
if
m[i
+
1
][j
+
1
]>mmax:
mmax
=
m[i
+
1
][j
+
1
]
p
=
i
+
1
return
s1[p
-
mmax:p],mmax
#返回最长子串及其长度
print
find_lcsubstr(
'abcdfg'
,
'abdfg'
)
|
运行得到输出:('dfg',3) 。
最长公共子序列 (The Longest Common Subsequence) 。
子串要求字符必须是连续的,但是子序列就不是这样。最长公共子序列是一个十分实用的问题,它可以描述两段文字之间的“相似度”,即它们的雷同程度,从而能够用来辨别抄袭。对一段文字进行修改之后,计算改动前后文字的最长公共子序列,将除此子序列外的部分提取出来,这种方法判断修改的部分,往往十分准确。 解法就是用动态回归的思想,一个矩阵记录两个字符串中匹配情况,若是匹配则为左上方的值加1,否则为左方和上方的最大值。一个矩阵记录转移方向,然后根据转移方向,回溯找到最长子序列.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
|
import
numpy
def
find_lcseque(s1, s2):
# 生成字符串长度加1的0矩阵,m用来保存对应位置匹配的结果
m
=
[ [
0
for
x
in
range
(
len
(s2)
+
1
) ]
for
y
in
range
(
len
(s1)
+
1
) ]
# d用来记录转移方向
d
=
[ [
None
for
x
in
range
(
len
(s2)
+
1
) ]
for
y
in
range
(
len
(s1)
+
1
) ]
for
p1
in
range
(
len
(s1)):
for
p2
in
range
(
len
(s2)):
if
s1[p1]
=
=
s2[p2]:
#字符匹配成功,则该位置的值为左上方的值加1
m[p1
+
1
][p2
+
1
]
=
m[p1][p2]
+
1
d[p1
+
1
][p2
+
1
]
=
'ok'
elif
m[p1
+
1
][p2] > m[p1][p2
+
1
]:
#左值大于上值,则该位置的值为左值,并标记回溯时的方向
m[p1
+
1
][p2
+
1
]
=
m[p1
+
1
][p2]
d[p1
+
1
][p2
+
1
]
=
'left'
else
:
#上值大于左值,则该位置的值为上值,并标记方向up
m[p1
+
1
][p2
+
1
]
=
m[p1][p2
+
1
]
d[p1
+
1
][p2
+
1
]
=
'up'
(p1, p2)
=
(
len
(s1),
len
(s2))
print
numpy.array(d)
s
=
[]
while
m[p1][p2]:
#不为None时
c
=
d[p1][p2]
if
c
=
=
'ok'
:
#匹配成功,插入该字符,并向左上角找下一个
s.append(s1[p1
-
1
])
p1
-
=
1
p2
-
=
1
if
c
=
=
'left'
:
#根据标记,向左找下一个
p2
-
=
1
if
c
=
=
'up'
:
#根据标记,向上找下一个
p1
-
=
1
s.reverse()
return
''.join(s)
print
find_lcseque(
'abdfg'
,
'abcdfg'
)
|
得到输出结果:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.
原文链接:https://blog.csdn.net/wateryouyo/article/details/50917812 。
最后此篇关于详解Python最长公共子串和最长公共子序列的实现的文章就讲到这里了,如果你想了解更多关于详解Python最长公共子串和最长公共子序列的实现的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我有这个 html 代码: HELLO WORLD! X V HELLO WORLD! X V 我想按 X(类关闭)将父 div 的高度更改为 20px 并显示 V(类打开),但在每个 d
在会计应用程序的许多不同实现中,有两种主要的数据库设计方法来保存日志和分类帐数据。 只保留 Journal 信息,然后 Ledger 只是 Journal 的一个 View (因为 journal 总
我想在另一个子里面有一个子, sub a { sub b { } } 我想为每次调用 sub b 创建一个新的 sub a 实例。有没有办法在 Perl 中做到这一点? 当我运行上面的
我有一些代码正在查找重复项并突出显示单元格: Private Sub cmdDups_Click() Dim Rng As Range Dim cel As Range Set Rng = ThisW
可能有一个简单的解决方案,但我很难过。 我有一个包含一个 ID 字段的主表。在两个可能的字段中有一个具有该 ID 的子表。想象一个由选手 A 和选手 B 组成的 double 队。Master 表将有
假设我有一个包含对象的数组: [ { "id": "5a97e047f826a0111b754beb", "name": "Hogwarts", "parentId": "
我正在尝试对 MySQL 数据库表执行一对父/子模型的批量插入,但似乎无法使用标准的 ActiveRecord 功能来完成。所以,我尝试了 activerecord-import gem,但它也不支持
我有一个带有多个子类的父抽象类。最终,我希望通过 GUI 中的进度条显示子类中完成的进度。 我目前所做的,我意识到这是行不通的,是在父类中声明为每个子类将覆盖的虚拟方法的事件方法定义。所以像: pub
是否可以通过键数组在对象中设置变量?例如我有这个对象: var obj = {'outer': {'inner': 'value'} }; 并希望设置由键数组选择的值: var keys = ['ou
我有一个名为 companies 的 MySQL 表,如下所示: +---------+-----------+-----------+ | id_comp | comp_name | id_pare
我正在尝试使用 sublime text 在 sublime text 上的 ionic 上打开我的第一个应用程序。它给了我一个“找不到命令”的错误。如何修复? 我试过这些命令: sudo rm -r
不好意思问,但我正在使用 webapp2,我正在设计一个解决方案,以便更容易定义路由 based on this google webapp2 route function .但这完全取决于能够在子级
我有代表树的数字字符串(我不知道是否有官方名称): 012323301212 上面的例子代表了 2 棵树。根用 0 表示。根的直接子代为“1”,“1”的直接子代为“2”,依此类推。我需要将它们分组到由
是否可以在当前 Activity 之上添加 Activity 。例如,假设我单击一个按钮,然后它将第二个 Activity 添加到当前 Activity 。而第二个 Activity 只覆盖了我当前
我很难思考如何为子资源建模。 以作者的书籍为例。你可以有 N 本书,每本书只有一位作者。 /books GET /books POST /books/id PUT /books/id DELETE 到
有人可以向我解释以下内容(python 2.7) 来自已解析文件的两个字符串数字: '410.9''410.9 '(注意尾随空格) A_LIST = ['410.9 '] '410.9' in '41
背景 在 PowerShell 中构建 hash table 是很常见的通过特定属性快速访问对象,例如以 LastName 为基础建立索引: $List = ConvertFrom-Csv @' I
我真的很难弄清楚如何调用嵌套 Polymer Web 组件的函数。 这是标记: rise-distribution组件有 canPlay我想从 rise-playlist
我写了一个小工具转储(以 dot 格式)一个项目的依赖关系图,其中所有位于同一目录中的文件都聚集在一个集群中。当我尝试生成包含相应图形的 pdf 时,dot开始哭: 命令 dot -Tpdf trim
给定一个 CODE ref,是否可以: 访问该 CODE ref 的解析树 通过指定 CODE ref 的解析树来创建一个新的 CODE ref,该解析树可以包含在 1 中返回的解析树的元素 通常我们
我是一名优秀的程序员,十分优秀!