- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在研究移植 Python 库的可能性 Beautiful Soup转到.NET。主要是因为我真的很喜欢解析器,而且 .NET 框架上根本没有好的 HTML 解析器(Html Agility Pack 已经过时、有缺陷、没有文档记录,并且除非知道确切的架构,否则不能正常工作。)
我的主要目标之一是让基本的 DOM 选择功能真正与 BeautifulSoup 的美观和简单相提并论,让开发人员能够轻松地制作表达式来找到他们正在寻找的元素。
BeautifulSoup 利用松散绑定(bind)和命名参数来实现这一点。例如,查找所有 id
为 test
且 title
包含单词 的 a
标签>foo,我可以:
soup.find_all('a', id='test', title=re.compile('foo'))
但是,C# 没有任意数量的命名元素的概念。 .NET4 运行时具有命名参数,但它们必须与现有方法原型(prototype)相匹配。
我的问题:与这种 Pythonic 结构最相似的 C# 设计模式是什么?
一些想法:
作为一名开发人员,我想根据自己喜欢的编码方式来追求这一点。实现它超出了本文的范围。我的一个想法是使用匿名类型。像这样的东西:
soup.FindAll("a", new { Id = "Test", Title = new Regex("foo") });
虽然这种语法与 Python 实现大致匹配,但它仍然有一些缺点。
FindAll
实现必须使用反射来解析匿名类型,并以合理的方式处理任意元数据。FindAll
原型(prototype)需要一个Object
,这使得除非您非常熟悉记录的行为,否则如何使用该方法相当不清楚。我认为没有办法声明必须采用匿名类型的方法。我的另一个想法可能是一种更 .NET 的处理方式,但与库的 Python 根源相去甚远。那就是使用流畅的模式。像这样的东西:
soup.FindAll("a")
.Attr("id", "Test")
.Attr("title", new Regex("foo"));
这需要构建表达式树并在 DOM 中定位适当的节点。
我的第三个也是最后一个想法是使用 LINQ。像这样的东西:
var nodes = (from n in soup
where n.Tag == "a" &&
n["id"] == "Test" &&
Regex.Match(n["title"], "foo").Success
select n);
我非常感谢任何有将 Python 代码移植到 C# 的经验的人的任何见解,或者只是关于处理这种情况的最佳方法的总体建议。
最佳答案
您是否尝试过在 IronPython 引擎中运行您的代码。据我所知,它的性能非常好,而且您不必接触 Python 代码。
关于c# - 将一个非常 Python 风格的库移植到 .NET,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10435039/
创建使用.NET框架的asp.net页面时,访问该页面的客户端是否需要在其计算机上安装.NET框架? IE。用户访问www.fakesite.com/default.aspx,如果他们没有安装框架,他
我阅读了很多不同的博客和 StackOverflow 问题,试图找到我的问题的答案,但最后我找不到任何东西,所以我想自己问这个问题。 我正在构建一个应用程序,其中有一个长时间运行的工作线程,它执行一些
已锁定。这个问题及其答案是locked因为这个问题是题外话,但却具有历史意义。目前不接受新的答案或互动。 我一直想知道为什么微软为这样一个伟大的平台选择了一个如此奇怪的、对搜索引擎不友好的名称。他们就
.Net Framework .Net .NET Standard的区别 1、.NET Framework 在未来.NET Framework或许成为过去时,目前还是有很多地方在使用的。这一套
如果有选择的话,您会走哪条路? ASP.NET Webforms + ASP.NET AJAX 或 ASP.NET MVC + JavaScript Framework of your Choice
我有一个 Web 服务,它通过专用连接通过 https 使用第三方 Web 服务,我应用了 ServicePointManager.ServerCertificateValidationCallbac
为什么我应该选择ASP.NET Web Application (.NET Framework)而不是ASP.NET Core Web Application (.NET Framework)? 我在
我在网络上没有找到任何关于包含 .NET Standard、.NET Core 和 .NET Framework 项目的 .NET 解决方案的公认命名约定。 就我而言,我们在 .NET 框架项目中有以
.NET Compact 是 .NET 的完美子集吗? 假设我考虑了屏幕大小和其他限制并避免了 .NET Compact 不支持的类和方法,或者 .NET Compact 是一个不同且不兼容的 GUI
我已经阅读了所有我能找到的关于 connectionManagement 中的 maxconnection 设置的文章:即 http://support.microsoft.com/kb/821268
我现在正在使用asp.net mvc,想知道使用内置的Json或 Json.Net哪个是更好的选择,但我不确定一个人是否比另一个人有优势。 另外,如果我确实选择沿用Json.Net的路线,那么我应该选
在 Visual Studio 中,您至少可以创建三种不同类型的类库: 类库(.NET Framework) 类库(.NET 标准) 类库(.NET Core) 虽然第一个是我们多年来一直使用的,但我
.NET 和 ASP.NET 之间有什么区别?它们有什么关系? 最佳答案 ASP.Net 基于 .Net 框架构建,提供有关 Web 开发的附加功能。 你可以去看看wikipedia article
在安装更高版本(3.0)之前,我需要安装.net框架1.1和2.0吗?或者单独安装 3.0 框架就足够了,并为在早期框架版本上编写的软件提供支持?谢谢 ,丽然 最佳答案 不,您不必安装以前的框架。 我
我正在开发一个项目,人们可以“更新”类别,例如更改类别的名称。我收到以下消息 This is called after clicking update 按钮 with the SQL statemen
.NET 类 System.Net.CookieContainer 线程安全吗? --更新:交 key 答复-- 是否有任何方法可以确保异步请求期间修改的变量(即 HttpWebRequest.Coo
我正在使用 JScript.NET 在我编写的 C# WinForms 应用程序中编写脚本。它工作得很好,但我只是尝试在脚本中放置一些异常处理,但我无法弄清楚如何判断我的 C# 代码抛出了哪种类型的异
我需要你的帮助, 比如我有一个小数类型的变量,我想这样取整。 例如 3.0 = 3 3.1 = 4 3.2 = 4 3.3 = 4 3.4 = 4 3.5 = 4 3.6 = 4 3.7 = 4 3.
我使用过这样的代码:http://msdn.microsoft.com/en-us/library/dw70f090.aspx在 ASP.NET 中工作之前访问数据库(2-3 年前)。我没有意识到我正
自 ConfigurationManager .NET Standard 中不存在,检索正在执行的程序集的应用程序设置的最佳方法是什么,无论是 web.config或 appSettings.{env
我是一名优秀的程序员,十分优秀!