python-3.x - Markdown 文本突出显示性能问题

python-3.x - Markdown 文本突出显示性能问题 - Tkinter

转载作者：行者123 更新时间：2023-12-04 08:27:32

26

4

概览

我正尝试在我的项目的文本编辑器中添加 markdown 语法高亮显示，但我在让它用户证明，同时保持性能友好方面遇到了一些问题

基本上，我在寻找这个——来自 Visual Studio Code 的 markdown:

我说的是粗体、斜体、列表等的简单突出显示，以指示用户预览其 Markdown 文件时将应用的样式。

我的解决方案

我最初为我的项目设置了这个方法(简化了问题并使用颜色使样式更清晰以便调试)

import re
import tkinter

root = tkinter.Tk()
root.title("Markdown Text Editor")
editor = tkinter.Text(root)
editor.pack()

# bind each key Release to the markdown checker function
editor.bind("<KeyRelease>", lambda event : check_markdown(editor.index('insert').split(".")[0]))


# configure markdown styles
editor.tag_config("bold",           foreground = "#FF0000") # red for debugging clarity
editor.tag_config("italic",         foreground = "#00FF00") # green for debugging clarity
editor.tag_config("bold-italic",    foreground = "#0000FF") # blue for debugging clarity


# regex expressions and empty tag legnth
search_expressions = {
#   <tag name>    <regex expression>   <empty tag size>
    "italic" :      ["\*(.*?)\*",           2],
    "bold" :        ["\*\*(.*?)\*\*",       4], 
    "bold-italic" : ["\*\*\*(.*?)\*\*\*",   6],
}


def check_markdown(current_line):
    # loop through each tag with the matching regex expression
    for tag, expression in search_expressions.items():
        # start and end indices for the seach area
        start_index, end_index = f"{current_line}.0", f"{current_line}.end"

        # remove all tag instances
        editor.tag_remove(tag, start_index, end_index)
        
        # while there is still text to search
        while 1:
            length = tkinter.IntVar()
            # get the index of 'tag' that matches 'expression' on the 'current_line'
            index = editor.search(expression[0], start_index, count = length, stopindex = end_index, regexp = True)
            
            # break if the expression was not met on the current line
            if not index: 
                break
            
            # else is this tag empty ('**' <- empty italic)
            elif length.get() != expression[1]: 
                # apply the tag to the markdown syntax
                editor.tag_add(tag, index, f"{index}+{length.get()}c")

            # continue searching after the markdown
            start_index = index + f"+{length.get()}c"

            # update the display - stops program freezing
            root.update_idletasks()

            continue

        continue

    return

root.mainloop()

我推断，通过删除每个 KeyRelease 的所有格式，然后重新扫描当前行，它减少了语法被误解的数量，例如粗体斜体被误解为粗体或斜体，以及标签相互堆叠。这适用于一行中的几个句子，但如果用户在一行中键入大量文本，性能会迅速下降，并且要等待很长时间才能应用样式 - 特别是当涉及许多不同的 markdown 语法时。

我使用 Visual Studio Code 的 markdown 语言突出显示作为比较，它可以在一行中处理更多的语法，然后出于“性能原因”删除突出显示。

我知道每个 keyReleaee 都需要大量的循环，但我发现替代方案要复杂得多，同时并没有真正提高性能。

替代方案

我想，让我们减少负载吧。我已经测试过每次用户键入星号和 m-dashes 等 Markdown 语法时检查，并对任何已编辑的标签(标签范围内的 key 发布)进行验证。但是用户输入有很多变量需要考虑——比如当文本被粘贴到编辑器中时，因为很难确定某些语法组合可能对周围文档 Markdown 产生什么影响——这些需要检查和验证。

有没有更好更直观的高亮markdown方法我还没有想到？有没有办法大大加快我最初的想法？或者是 python 和 Tkinter 根本无法足够快地完成我想要做的事情。

提前致谢。

最佳答案

如果您不想使用外部库并保持代码简单，使用 re.finditer() 似乎比 Text.search() 更快。

您可以使用单个正则表达式来匹配所有情况:

regexp = re.compile(r"((?P<delimiter>\*{1,3})[^*]+?(?P=delimiter)|(?P<delimiter2>\_{1,3})[^_]+?(?P=delimiter2))")

“定界符”组的长度为您提供了标签，匹配范围为您提供了应用标签的位置。

代码如下:

import re
import tkinter

root = tkinter.Tk()
root.title("Markdown Text Editor")
editor = tkinter.Text(root)
editor.pack()

# bind each key Release to the markdown checker function
editor.bind("<KeyRelease>", lambda event: check_markdown())

# configure markdown styles
editor.tag_config("bold", foreground="#FF0000") # red for debugging clarity
editor.tag_config("italic", foreground="#00FF00") # green for debugging clarity
editor.tag_config("bold-italic", foreground="#0000FF") # blue for debugging clarity

regexp = re.compile(r"((?P<delimiter>\*{1,3})[^*]+?(?P=delimiter)|(?P<delimiter2>\_{1,3})[^_]+?(?P=delimiter2))")
tags = {1: "italic", 2: "bold", 3: "bold-italic"}  # the length of the delimiter gives the tag


def check_markdown(start_index="insert linestart", end_index="insert lineend"):
    text = editor.get(start_index, end_index)
    # remove all tag instances
    for tag in tags.values():
        editor.tag_remove(tag, start_index, end_index)
    # loop through each match and add the corresponding tag
    for match in regexp.finditer(text):
        groupdict = match.groupdict()
        delim = groupdict["delimiter"] # * delimiter
        if delim is None:
            delim = groupdict["delimiter2"]  # _ delimiter
        start, end = match.span()
        editor.tag_add(tags[len(delim)], f"{start_index}+{start}c", f"{start_index}+{end}c")
    return

root.mainloop()

请注意，check_markdown() 仅在 start_index 和 end_index 在同一行时有效，否则您需要拆分文本并执行逐行搜索。

关于python-3.x - Markdown 文本突出显示性能问题 - Tkinter，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65192363/

26

4

0

文章推荐： c - 获取距离 2 中的邻居 c 中的图邻接表

文章推荐： snowflake-cloud-data-platform - 雪花到谷歌云存储 - 存储桶安全

文章推荐： reactjs - React Navigation Shared Element 5 嵌套导航器

tkinter - 使 Tkinter 跳到前面 - 但仅相对于 Tkinter 程序
在 How to make a Tkinter window jump to the front? 中提出的问题之后的一个问题我希望有一个顶层窗口(我用它来导航我的其他主窗口)总是在前面。但我希望它
tkinter - Tkinter 中的堆叠顺序维护
有没有办法在 Tkinter 中保持小部件(特别是图像)的堆叠顺序一致？例如，我可能在 Canvas 上的同一位置有两个矩形、两个三角形和一个圆。圆圈移动到最后一次点击鼠标的地方，但我总是希望它被绘制
tkinter - Tkinter 行为迟缓
这是一个简单的 GUI 程序，用于创建 5x16 按钮矩阵。 from tkinter import * root = Tk() button = [[0 for x in range(16)] fo
python - 为什么我需要导入 tkinter.messagebox 但导入 tkinter 后不需要导入 tkinter.Tk()？
有一个错误:“AttributeError: module 'tkinter' has no attribute 'messagebox'” 即使 import tkinter 一开始就已经给出了，为
tkinter - 如何在 tkinter 菜单中自动打开子菜单？
我知道 menu.tk_popup() 可用于在特定坐标处打开上下文菜单，但也不知道如何从中打开子菜单，如果这有意义的话。这是我编写的代码: import tkinter as tk root = t
tkinter - 无法在 Tkinter 中禁用自动换行
我正在尝试在禁用自动换行和水平滚动条的文本窗口中书写，如下所示: root = Toplevel() root.geometry("%dx%d+0+0" % (350,400)) af=Frame(r
tkinter - 从 tkinter 中的小部件中删除文本变量
已经将文本变量分配给小部件后，如何将其删除？ widget.config(textvariable=None)只是不工作。在谷歌或这里找不到任何东西。最佳答案将您的变量分配给一个空字符串以实现此目
tkinter - Jython 是否支持 Tkinter
Jython 支持 Tkinter 吗？如果我用 Python 编写一个程序并放一个使用 Tkinter 的 GUI 前端，做同样的事情有多难 Jython 中的程序？或者对于 Jython GUI
tkinter - 如何获取当前日期以显示在 tkinter 窗口中
因此，我尝试创建一个 tkinter 窗口，显示当前时间和日期以及自定义短语。不过，我遇到的问题是，我似乎无法在第二天刷新日期。我可以传递截至运行代码时的当前日期，但之后它变为静态。这是我目前的程
tkinter - 如何在 tkinter 中设置最小窗口大小？
我的理解是在初始化 __init__ 中的所有框架和小部件之后方法，tkinter 窗口会调整大小以适合所有这些组件。我想将窗口的初始化大小设置为其最小大小。我希望能够最大化并放大窗口，但我从不希望
tkinter - 如何在 Tkinter 中垂直居中小部件？
此代码仅水平居中，如何使进度条也垂直居中？ import Tkinter import ttk root = Tkinter.Tk() root.geometry("=500x500") root.p
tkinter - 使用 Tkinter 设置菜单小部件的宽度
使用 Python 2.7 和 Tkinter 模块，我创建了一个菜单按钮并为其分配了一个菜单。现在每次我在特定位置发布菜单时，菜单的宽度都会根据字符数自动设置。有没有办法在菜单小部件中设置静态宽度？
tkinter - 如何更改 tkinter 应用程序的整体主题？
我想将我的 tkinter 应用程序的主题更改为 clam。代码是什么，我把它放在哪里？我试过了: from tkinter import * from tkinter.ttk import * s
python - Tkinter -tkinter.TclError
我有以下代码: from Tkinter import * from urllib import urlretrieve import webbrowser import ttk def get_la
python - Tkinter |如何检测接近末尾的 tkinter 滚动条位置
我知道，如果我将滚动条控制的框架绑定(bind)到函数 ( onFrameConfigure )，您可以获得滚动条位置，如下所示:self.calendar_frame.bind("", self.o
tkinter - python tkinter 菜单，如何更改字体？
许多网站都说菜单小部件有一个选项“字体”，但我一直无法设置它。系统是在 Windows 8.1 中运行的 Python 3.5。脚本开始: 从 tkinter 导入 * 根 = Tk() root.g
tkinter - tkinter 和 wxWidgets 的优缺点？
我正在阅读本教程，它帮助我同时学习 tkinter 和 wxWidgets，但我想深入挖掘，所以想知道哪个 GUI 工具更适合深入学习，为什么？最佳答案不可能说哪个“更好”。两者均可用于最常见的用
python | tkinter : What does tkinter. END 做什么？
看书学python，tkinter.END用在一段代码里不用解释 import tkinter def count(text, out_data): """ Update out_data w
python - 无法导入 tkinter(或 Tkinter)
我正在尝试使用 Python 2.7 将 Tkinter 导入到我的项目中，但我收到了错误: ImportError: No module named tkinter 在有人说之前，我已经尝试了“Tk
python - tkinter 和 Tkinter 之间的区别
当我回答 Tkinter 问题时，我通常会尝试自己运行代码，但有时我会收到此错误: Traceback (most recent call last): File "C:\Python27\pyg

首页

博学

6Ren·AI

商城