- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
所以,我想将莎士比亚的一部戏剧《哈姆雷特》表示为以下对象(也许这不是最好的表示,如果是请告诉我):
class Play():
acts = []
...
def add_act(self, act): acts.append(act)
class Act():
scenes = []
...
def add_scene(self, scene): scenes.append(scene)
class Scene():
elems = []
def __init__(self, title, setting=""): ...
def add_elem(self, elem): elems.append(elem)
...
class StageDirection(): # elem
def __init__(self, text): ...
class Line(): # elem
def __init__(self, id, text, character = None): ...
# A None character represents a continuation from the previous line
# id could be, for example, 1.1.1
当然,每个类中还有其他方法用于打印等。
问题是,如何从如下所示的 HTML 4 代码中获取基于这些类(或类似类)的结构:
<H3>ACT I</h3>
<h3>SCENE I. Elsinore. A platform before the castle.</h3>
<p><blockquote>
<i>FRANCISCO at his post. Enter to him BERNARDO</i>
</blockquote>
<A NAME=speech1><b>BERNARDO</b></a>
<blockquote>
<A NAME=1.1.1>Who's there?</A><br>
</blockquote>
<A NAME=speech2><b>FRANCISCO</b></a>
<blockquote>
<A NAME=1.1.2>Nay, answer me: stand, and unfold yourself.</A><br>
</blockquote>
<A NAME=speech3><b>BERNARDO</b></a>
<blockquote>
<A NAME=1.1.3>Long live the king!</A><br>
</blockquote>
<A NAME=speech4><b>FRANCISCO</b></a>
<blockquote>
<A NAME=1.1.4>Bernardo?</A><br>
</blockquote>
<A NAME=speech5><b>BERNARDO</b></a>
<blockquote>
<A NAME=1.1.5>He.</A><br>
</blockquote> <!-- for more, see the source of shakespeare.mit.edu/hamlet/full.html -->
把它翻译成这样:
play = Play()
actI = Act()
sceneI = Scene("Scene I", "Elsinore. A platform before the castle.")
sceneI.add_elem(StageDirection("Francisco at his post. Enter to him Bernardo."))
sceneI.add_elem(Line("Bernardo", "Who's there?"))
...
当然,我不期望所有代码 — 但我应该使用哪些库,如果没有库,我应该使用逻辑吗?
谢谢。
(这是为了 future 的开源项目,我学习 Python 是为了好玩,而不是家庭作业。)
最佳答案
使用lxml
或类似的解析器。他们会将您的 HTML(XML?)读入文档树,这基本上是您编写的数据结构的更通用版本。
然后您可以遍历生成的树并修剪它或在内存中重建另一棵看起来像您想要的方式的树。但是 HTML -> 数据结构步骤是一个已解决的问题。
等等,您想生成实际的 Python 代码吗?你到底为什么想要那个?
关于python - 将 HTML 中的播放翻译成 python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4637314/
我正在尝试读取和处理一个大的 json 文件(~16G),但即使我通过指定 chunksize=500 读取小块,它仍然有内存错误。我的代码: i=0 header = True for chunk
请看下图... 我想通过 CSS 实现。 我现在将此分隔符用作在我的容器内响应的图像 ( jpg )。问题是我似乎无法准确匹配颜色或使白色晶莹剔透。 我认为 CSS 是解决这个问题的最佳方式。 尺寸为
所以我正在尝试使用 AngularJS 和 Node.js。我正在尝试设置客户端路由,但遇到一些问题。 编辑 所以我改变了一些代码如下 https://github.com/scotch-io/sta
我想创建如下图所示的边框: 这段代码是我写的 Some Text p{ -webkit-transform: perspective(158px) rotateX(338deg); -webk
好的,所以我有一个包含 2 个选项的选择表 $builder->add('type', 'choice', array( 'label' => 'User type', 'choice
我的代码: private void pictureBox1_MouseDown(object sender, MouseEventArgs e) { ngr.
我正在尝试编写 Tic-Tac-Toe 游戏代码,但不知道如何在轮到我时push_back '+' 字符。 因此,每当玩家输入例如“Oben 链接”时,这基本上意味着左上角,我希望游戏检查输入是否正确
我正在研究 HtmlHelper.AnonymousObjectToHtmlAttributes。 它适用于匿名对象: var test = new {@class = "aaa", placehol
在 stackoverflow 上所有这些 mod 重写主题之后,我仍然没有找到我的问题的答案。我有一个顶级站点,基本上我想做的就是将 /index.php?method=in&cat=Half+Li
仅使用 CSS 可以实现此功能区吗? 最佳答案 .box { width: 300px; height: 300px; background-color: #a0a0a0;
我有一个 jbuilder 模板,它用 json 表示我的一个模型,如下所示: json.(model, :id, :field1, :field2, :url) 如果我只是从控制台访问该字段,则 u
昨天我问了一个问题 - Draw arrow according to path 在那个问题中,我解释说我想在 onTouchEvent 的方向上绘制一个箭头。我在评论中得到了答案,说我应该旋转 Ca
我希望段落中的代码与代码块中显示的代码一致。 例如: The formula method for a linear model is lm(y~x, data = dat). For our da
我使用 ViewPager 获得了一个选项卡菜单。每个选项卡都包含来自 android.support.v4 包的 fragment (与旧 SDK 的兼容性)。其中一个 fragment 是 Web
我正在从事一项需要多种程序能力的科学项目。在四处寻找可用的工具后,我决定使用 Boost 库,它为我提供了 C++ 标准库不提供的所需功能,例如日期/时间管理等。 我的项目是一组命令行,用于处理来自旧
外媒 Windows Latest 报道,随着 Windows 10 的不断发展,某些功能会随着新功能的更新而被抛弃或成为可选项。早在 2018 年,微软就确认截图工具将消失,现代的 “截图和草图”
我有标记的 Angular ,我只希望标记旋转到那个 Angular 。 marker = new google.maps.Marker({ position: myL
我一定是遗漏了什么,但我不知道是什么。我有使用 polymer 实现的简单自定义元素: TECK ..
我有一个关于如何设置我们产品的分步教程。我必须在每个步骤中显示大量示例代码。以下是我必须在页面中显示的代码类型列表。我用什么来格式化所有内容? Java 代码示例 XML 样本 iOS SDK 文件(
我需要在我的 iPad 应用程序中绘制一些图表,所以我遵循了本教程: http://recycled-parts.blogspot.com/2011/07/setting-up-coreplot-in
我是一名优秀的程序员,十分优秀!