- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
所以问题的基本前提是我们有一个文本文件,其中包含可能是也可能不是 Web 服务的数据列表。从文本文件中存在的 Web 服务列表中,我想解析每个 Web 服务可用的 Web 方法并将此数据发布到 Excel 工作表。
我会给你一个测试数据的例子:
<Resource Name="APP1">
<Uri UriType="PAGE" ResourceUri="http://exampleurl/default.aspx" />
</Resource>
<Resource Name="App2">
<Uri UriType="PAGE" ResourceUri="http://exampleurl2/example.aspx" />
</Resource>
<Resource Name="App3">
<Uri UriType="PAGE" ResourceUri="http://exampleurl3/exampleapp.asmx" />
</Resource>
基本上,最后一行是我想使用的行。另一个可用行的例子是
<Resource Name="Example" WSDL="http://example.wsdl">
<Uri UriType="ASMX" ResourceUri="http://example.asmx" />
</Resource>
所以,我实际上是在寻找 .asmx
和 .wsdl
文件。我考虑这个问题的方式是将我的输入标准化,只为这些 Web 服务中的每一个寻找 WSDL,因此对于具有 .asmx
的 URL,我将添加 ?wsdl
.
现在,下面是我已经实现的解决方案。由于源文件中有数以千计的 Web 服务,并且可能有 n 个 Web 方法,我发现执行时间长达 1-2 小时。我想知道是否可以进一步改进此解决方案以加快运行时间。
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.IO;
using System.Text.RegularExpressions;
using System.Xml;
using System.Net;
using System.Data;
using ClosedXML.Excel;
namespace ParseWebservices
{
class Program
{
static void Main(string[] args)
{
var lines = File.ReadAllText(@"PATH\SourceFIle.xml");
int count = 0;
string text = "";
DataTable Webservices= new DataTable();
Webservices.Columns.Add("Wsdl URL");
Webservices.Columns.Add("Webservice Name");
Webservices.Columns.Add("WebMethod");
Regex r = new Regex("(?<=ResourceUri=\")(.*)(.asmx)(?=\")", RegexOptions.IgnoreCase);
Match m = r.Match(lines.ToString());
while (m.Success)
{
try
{
string[] test = m.ToString().Split('/');
string webservicename = test[test.Length - 1].Replace(".asmx", "");
string wsdlurl="";
var webClient = new WebClient();
string readHtml="";
try
{
readHtml = webClient.DownloadString(wsdlurl);
}
catch (Exception excxx)
{
wsdlurl = m.ToString().Replace(".asmx", ".wsdl");
readHtml = webClient.DownloadString(wsdlurl);
}
int count2 = 0;
string text2 = "";
Regex r2 = new Regex(@"(?<=s:element name\=\"")(.*)(?=Response"")", RegexOptions.IgnoreCase);
Match m2 = r2.Match(readHtml);
while (m2.Success)
{
DataRow dr = Webservices.NewRow();
dr[0] = wsdlurl;
dr[1] = webservicename;
dr[2] = m2.ToString();
Console.WriteLine(wsdlurl + "\n" + webservicename + "\n" + m2.ToString());
Webservices.Rows.Add(dr);
count2++;
m2 = m2.NextMatch();
}
count++;
m = m.NextMatch();
}
catch (Exception ex)
{
m = m.NextMatch();
}
}
XLWorkbook wb = new XLWorkbook();
wb.Worksheets.Add(Webservices, "Example");
wb.SaveAs(@"PATH\example.xlsx");
}
}
}
我不喜欢这个解决方案的一点是它依赖于异常。因为正则表达式匹配 .asmx
字符串,我意识到它无法找到 .wsdl
的字符串。但我也注意到,在包含.wsdl
的源文本中,.asmx
前缀是完全相同的。所以我为那些测试用例添加了错误处理,但绝对不理想。
无论如何,如果有任何关于如何改进并使其更快(更好!)的建议,我将不胜感激。
最佳答案
这很慢,因为它是在一个线程上完成的! (无论是 xml 还是 regex 都与速度缓慢无关:真正拖慢你速度的是所有内联网络请求)
没有您的源文件就很难做一个工作示例,所以我编写了一个辅助扩展来异步加载 Urls 列表 - 您显然需要围绕它填充代码。
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.IO;
using System.Text.RegularExpressions;
using System.Xml;
using System.Net;
using System.Data;
using System.Collections.Concurrent;
using System.Threading.Tasks;
namespace ParseWebservices
{
static class UrlLoaderExtension
{
public static async Task<ConcurrentDictionary<string, string>> LoadUrls(this IEnumerable<string> urls)
{
var result = new ConcurrentDictionary<string,string>();
Task[] tasks = urls.Select(url => {
return Task.Run(async () =>
{
using (WebClient wc = new WebClient())
{
// Console.WriteLine("Thread: " + System.Threading.Thread.CurrentThread.ManagedThreadId);
try
{
var r = await wc.DownloadStringTaskAsync(url);
result[url] = r;
}
catch (Exception err)
{
result[url] = err.Message;
}
}
});
}).ToArray();
await Task.WhenAll(tasks);
return result;
}
}
class Program
{
static void Main(string[] args)
{
var requests = new ConcurrentDictionary<string,string>();
// load desired urls into the structure
requests["http://www.microsoft.com"] = null;
requests["http://www.google.com"] = null;
requests["http://www.google.com/asdfdsaf"] = null;
try
{
Task.Run(async () =>
{
requests = await requests.Keys.LoadUrls();
}).GetAwaiter().GetResult();
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
Console.ReadLine();
return;
}
Console.WriteLine("Finished loading data concurrently");
Console.ReadLine();
// this part is synchronous (it's not waiting for IO)
foreach(var url in requests.Keys)
{
var response = requests[url];
Console.WriteLine(response); //
Console.WriteLine("Response from " + url);
Console.ReadLine();
}
Console.Write("DONE");
Console.ReadLine();
}
}
}
我建议您将您的 url 放入此演示中,以了解您能够以多快的速度加载数据:它告诉您加载完成的时间点是它收集了所有响应。
然后,在您确定这有多快(非常!)之后,您将有动力围绕它填充其他逻辑:)
希望对您有所帮助!
关于c# - 改进解析解决方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36429028/
我只是想知道要安装哪个版本的 Visual Studio 2010(专业版或高级版)提示升级项目.. 项目包括:asp.net mvc、数据库和silverlight。 最佳答案 通常,由不同版本的相
几种通过 iproute2 来打通不同节点间容器网络的方式 几种通过 iproute2 来打通不同节点间容器网络的方式 host-gw ipip vxlan 背景 之前由于需
目录 前言 1、TypeHandler 简介 1.1转换步骤 1.2转换规则 2、JSON 转换 3、枚举转换 4、文章小结
目录 前言 1、常见 key-value 2、时效性强 3、计数器相关 4、高实时性 5、排行榜系列 6、文章小结 前言 在笔者 3 年的
目录 前言 四、技术选型 五、后端接口设计 5.1业务系统接口 5.2App 端接口 六、关键逻辑实现 6.1Red
目录 前言 一、需求分析 1.1发送通知 1.2撤回通知 1.3通知消息数 1.4通知消息列表 二、数据模型设计
目录 前言 一、多租户的概念 二、隔离模式 2.1独立数据库模式 2.2共享数据库独立数据架构 2.3共享数据库共享数据架构
导读: 虽然锁在一定程度上能够解决并发问题,但稍有不慎,就可能造成死锁。本文介绍死锁的产生及处理。 死锁的产生和预防 发生死锁的必要条件有4个,分别为互斥条件、不可剥夺条件、请求与保持条件和循环等待条
在浏览网页后,我找不到任何功能来执行此操作,我有可行的个人解决方案。也许它对某人有用。 **使用 Moment 插件转换日期。***moment(currentPersianDate).clone()
是否有一种解决方案可以很好地处理数字(1-10)手写?我试过tesseract,但我得到的只是垃圾。 理想情况下是 OSS,但商业也可以。 最佳答案 OpenCV 现在带有手写数字识别 OCR 示例。
在服务器应用程序上,我们有以下内容:一个称为 JobManager 的单例类。另一个类,Scheduler,不断检查是否需要向 JobManager 添加任何类型的作业。 当需要这样做时,调度程序会执
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
当您尝试从 GitHub 存储库安装某些 R 包时 install_github('rWBclimate', 'ropensci') 如果您遇到以下错误: Installing github repo
问题在以下链接中进行了描述和演示: Paul Stovell WPF: Blurry Text Rendering www.gamedev.net forum Microsoft Connect: W
我正在寻找一种解决方案,使用标准格式 a × 10 b 在科学记数法下格式化 R 中的数字。一些同行评审的科学期刊都要求这样做,并且手动修改图表可能会变得乏味。 下面是 R 标准“E 表示法”的示例,
已编辑解决方案(如下...) 我有一个启动画面,它被打包到它自己的 jar 中。它有效。 我可以通过以下方式从另一个 java 应用程序内部调用 Splash.jar: Desktop.getDesk
什么是创建像 PageFlakes 或 iGoogle 这样的门户网站的好框架/包? ?我们希望创建一个为员工提供 HR 服务的员工/HR 门户,但我们也需要一种足够灵活的产品,以便我们可以使用它来为
我正在寻找一种解决方案,使用标准格式 a × 10 b 在科学记数法下格式化 R 中的数字。一些同行评审的科学期刊都要求这样做,并且手动修改图表可能会变得乏味。 下面是 R 标准“E 表示法”的示例,
如何将 solr 与 heritrix 集成? 我想使用 heritrix 归档一个站点,然后使用 solr 在本地索引和搜索该文件。 谢谢 最佳答案 使用 Solr 进行索引的问题在于它是一个纯文本
完整日历不包含工作时间功能选项(在任何一天的议程 View 中选择第一行和最后一行 - 例如公司不工作)。我做到了类似的事情: viewDisplay: function(view){
我是一名优秀的程序员,十分优秀!