- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们正在使用 dtSearch 为一些外部网页编制索引。它抓取页面的整个 HTML 内容。
当一个页面出现在我们网站的搜索结果列表中时,我们希望显示包含其突出显示/粗体搜索词的内容的摘录作为结果的一部分(换句话说,每个人都习惯在每个谷歌结果下看到同样的东西)。
实现此目标的最佳方法是什么?你必须解析和删除 HTML 标签吗?如果是这样,您如何有效地做到这一点?
我们有一个有效的概念证明,显示了突出显示搜索词的摘录,但我们必须呈现标签,或者尝试将它们删除(正如我们已经尝试过的那样)并最终得到一些垃圾信息,这些信息不是真的很满足。
我认为我们使用 dtSearch 是偶然的。如果替代搜索工具能够代表我们执行此类操作,我们会考虑改用它。
我们基本上是在尝试决定是否需要编写自己的正则表达式来完成此任务,或者这是一个已被某些库或工具解决的众所周知的问题。
我们恰好在使用 .NET/C#。我认为这不是问题的核心,但可能会影响我们可以使用哪些库。
最佳答案
Google 在存在的地方使用 meta
描述标签,并且还将使用 rich snippet information在可用的地方。
除此之外,您可能需要执行自定义解析,但不要使用正则表达式来执行整个任务。相反,使用适当的解析器(例如 HTML Aglity Pack )并找到具有语义意义的标签(可能是标题、段落等)。一旦找到这些元素,您可以使用正则表达式来确定哪些匹配的标签会给出你是最好的片段,在哪里截断它,等等。
一个简单的流程:
p
内的 strong
)这不是一门精确的科学,即使对于 Google 也是如此。
关于c# - 我们如何在搜索结果中显示干净的、谷歌风格的摘录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14652506/
Textmate 语法(.tmLanguage 文件)有时以 XML 格式表示。 我想转换为更易读的格式(即 JSON 或 YAML)以集成到 VS Code 语法突出显示扩展中。 为了澄清我的意思,
如何通过 pandas 样式隐藏列标签?有一个 hide_index() 方法可以删除索引行,不幸的是 hide_column() 标签会删除整个列(标题和数据)。我只想隐藏标题。谢谢! 最佳答案 s
我正在考虑为一组服务使用 SOA 架构来支持我咨询的业务,以前我们使用数据库集成,其中每个应用程序从共享的 MS SQL 数据库中挑选出它需要的东西并使用它等等。我们有各种与怪物数据库(包括 java
所以我有以下代码,我想知道 Objective-C 中哪种“风格”被认为更好。 选项 1: id temp = [dictionary objectForKey: @"aBooleanValue"];
当创建一个没有类参数的对象时,我很难决定是否应该包含空括号。一个具体的例子:我正在与现有的 Java 代码交互,并创建一个实现名为 EventResponder 的接口(interface)的对象。我
我有一个抽象类Stack和一个扩展它的类:MyStack。我需要为 MyStack 创建一个复制构造函数。只传入 MyStack 对象更好,还是传入任何 Stack 对象更好? public MySt
我正在考虑将那些在函数体中未修改的 Python 函数参数拼写为 ALL_UPPERCASE,向此类 API 的用户发出信号,表明传递的值不会被修改(如果一切都如广告所言,无论如何) )。我不知道这会
我的 build.gradle 文件、staging、stable 和 production 以及默认构建类型 debug 和 release。对于其中的每一个,我都有不同的 AAR 文件,例如,我有
假设我有以下文件: main.cpp 例程.cpp 例程.h 进一步假设 main.cpp 调用了在 routine.cpp 中定义的函数 routine(),但是 routine.cpp 还包含仅由
我对此进行了一些搜索,但实际上我还没有找到 MySQL 中用于创建外键的样式概念是什么 - 在创建表定义中或在 alter 语句中。谢谢。 最佳答案 何时创建外键: 如果在创建表时明确需要外键,则在创
您好,我正在尝试将 Android 应用风格(免费且完整)实现为动态壁纸。在 Eclipse 中,我曾经使用以下代码从我自己的 Android Activity 打开动态壁纸预览: I
我的 Android 应用程序有两种不同的风格,lite 和 pro。在应用程序中,我有一个名为 customFragment.java 的类,它包含在 main 中(不同风格之间没有区别)并且还包含
我有一个包含多个子目录的项目,如下所示: /opt/exampleProject/src ├── __init__.py ├── dir1 │ ├── __init__.py │ ├──
假设我们有类似的东西 int f(int n); .... do{ int a = b; int b = f(a); } 这样说有没有风险 do{ int b = f(b);
是否有风格指导或理由来选择其中一种模式而不是另一种? 最小化上下文管理器下的代码量“感觉”更干净,但我无法指出具体原因。这可能只是偏好,并没有关于此事的官方指导。 1) 里面的所有代码都有上下文。 w
module Hints module Designer def self.message "Hello, World!" end
我正在开发一个具有多种风格的 android 项目。 这很好用,我可以自定义应用程序的元素,例如颜色和字符串资源。 我想让一些风格基于 AppCompat 浅色主题,一些基于 AppCompat 深色
因此,这不起作用,因为 seatsAvailable 是最终的。如何使用更多的 lambda 风格的从头开始的方式来完成我想要完成的事情? final boolean seatsAvailable =
考虑以下代码: cpu_set_t cpuset; CPU_ZERO(&cpuset); CPU_SET(0, &cpuset); sched_setaffinity(0, sizeof(cpuset
从历史上看,我总是这样编写我的异常处理代码: Cursor cursor = null; try { cursor = db.openCursor(null, null
我是一名优秀的程序员,十分优秀!