- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个小的 python 脚本,它遍历一个网页(http-crawling)。此网页托管在内部网中,并使用 NTLM 身份验证来收集对其的访问。
所以,我发现这个任务(检索 http-content)很容易使用 python 进行编程,而不是尝试将整个 python 脚本重新编写为 C#,然后通过 SSIS 上的“脚本任务”使用它,以完成任务。
我仔细查看了 SSIS 工具,发现有一个名为“Execute Process Task”的控制流,可以让您执行 Win32 可执行文件。
但问题在于如何调用我的 python 脚本,因为它不可执行并且需要由 python 解释器解释(如果您愿意重复)。因此,我很容易最终构建一个调用 python 脚本和解释器的简单“.bat”文件。然后通过 SSIS“执行进程任务”执行该文件。
还有其他方法可以实现吗? (整洁的方式)
从脚本中检索到的信息将从数据库中存储到一个表中,以便从另一个 SSIS 进程通过数据库表访问该信息。
我正在从不同的来源(平面文件、数据库表、http 请求等)检索信息,以便将该信息存档到可以发布在 Web 服务中的数据库中,然后从 Excel 项目中访问.
提前致谢!
最佳答案
在 SSIS 的范围内使用 IronPython 的最简单的机制是调用外部进程并转储到文件,然后将其用作数据流的源,至少对我来说是这样。
也就是说,我能够从 C# 托管一个 IronPython 应用程序并使用返回的数据填充输出缓冲区并与管道中的数据交互。我只有一台机器可以执行此操作,所以我列出了我记得在程序包变绿之前所做的所有事情。
这篇文章让我了解了如何完成这项工作。 Hosting IronPython in a C# 4.0 program我强烈建议您创建一个 C#/VB.NET 控制台应用程序,并首先让您的 IronPython 集成在那里工作,因为 SSIS 将为所有内容添加一个额外的层。
或许可以在 C# 中托管旧版本的 IronPython 而无需 4.0 框架,但这远远超出了我的能力范围。我能说的是,要使用 4.0 框架,您正在查看 SQL Server 2012。2008 包可以面向 3.5 框架(默认为 2.0)。
全局程序集缓存,简称GAC。它是 Windows 中一个特殊的地方,签名的程序集可以在其中生存。 SSIS 可能能够使用不在 GAC 中的程序集,但我没有运气这样做。这个案子也不异常(exception)。我的控制台应用程序运行良好,但是当我将该代码复制到 SSIS 中时,它会出现 Could not load file or assembly 'Microsoft.Scripting...
错误消息。幸运的是,IronPython-2.7.2.1(可能还有以前的版本)是强签名的 dll。这意味着您可以而且必须将它们添加到 GAC 中。
在您的 Visual Studio 目录中,查找 Visual Studio 命令提示符 (2010)。假设您的 IronPython 安装文件夹是 C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1
您将键入 cd C:\tmp\IronPython-2.7.2.1\IronPython-2.7 .2.1
然后我注册了下面3个程序集
C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1>gacutil -if Microsoft.Dynamic.dll
Microsoft (R) .NET Global Assembly Cache Utility. Version 4.0.30319.1
Copyright (c) Microsoft Corporation. All rights reserved.
Assembly successfully added to the cache
C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1>gacutil -if IronPython.dll
Microsoft (R) .NET Global Assembly Cache Utility. Version 4.0.30319.1
Copyright (c) Microsoft Corporation. All rights reserved.
Assembly successfully added to the cache
C:\tmp\IronPython-2.7.2.1\IronPython-2.7.2.1>gacutil -if Microsoft.Scripting.dll
Microsoft (R) .NET Global Assembly Cache Utility. Version 4.0.30319.1
Copyright (c) Microsoft Corporation. All rights reserved.
Assembly successfully added to the cache
我的 SSIS 项目,我已将 Run64bitRuntime 设置为 False,但在重新测试时,这并不重要。默认为 True,这似乎工作正常。
Python 脚本 - 我没有足够的背景知识来使 C# 和 .NET DLR 语言之间的集成更加优雅。最好提供一个字符串或包含我想要执行的脚本的东西,也许这就是脚本 block 的意义所在,但我没有时间研究。因此,此解决方案需要一个位于磁盘某处的脚本文件。我在使用托管脚本进行导入时遇到了问题(没有名为 X 的模块除外)。毫无疑问,类路径和所有需要提供给主机以使其正常工作的东西都有一些魔力。顺便说一句,这可能是一个不同的 SO 问题。
我有一个文件位于 C:\ssisdata\simplePy.py
# could not get a simple import to work from hosted
# works fine from "not hosted"
#import os
def GetIPData():
#os.listdir(r'C:\\')
return range(0,100)
将脚本任务添加到数据流后,我将其配置为在输出缓冲区 (wstr 1000) 上有一个列。然后我将其用作我的源代码。
using System;
using System.Collections.Generic;
using System.Data;
using Microsoft.SqlServer.Dts.Pipeline.Wrapper;
using Microsoft.SqlServer.Dts.Runtime.Wrapper;
using IronPython.Hosting;
using Microsoft.Scripting.Hosting;
/// <summary>
/// Attempt to use IP script as a source
/// http://blogs.msdn.com/b/charlie/archive/2009/10/25/hosting-ironpython-in-a-c-4-0-program.aspx
/// </summary>
[Microsoft.SqlServer.Dts.Pipeline.SSISScriptComponentEntryPointAttribute]
public class ScriptMain : UserComponent
{
/// <summary>
/// Create data rows and fill those buckets
/// </summary>
public override void CreateNewOutputRows()
{
foreach (var item in this.GetData())
{
Output0Buffer.AddRow();
Output0Buffer.Content = item;
}
}
/// <summary>
/// I've written plenty of code, but I'm quite certain this is some of the ugliest.
/// There certainly must be more graceful means of
/// * feeding your source code to the ironpython run-time than a file
/// * processing the output of the code the method call
/// * sucking less at life
/// </summary>
/// <returns>A list of strings</returns>
public List<string> GetData()
{
List<string> output = null;
var ipy = Python.CreateRuntime();
dynamic test = ipy.UseFile(@"C:\ssisdata\simplePy.py");
output = new List<string>();
var pythonData = test.GetIPData();
foreach (var item in pythonData)
{
output.Add(item.ToString());
}
return output;
}
}
快速了解我的引用资料的样子
点击运行按钮,大功告成
关于c# - SSIS:通过SSIS执行Ironpython或Ironruby脚本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10304549/
我有一个“有趣”的问题,即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出 但令我惊讶的是,当我执行它时 */50 * * *
JavaScript 是否被调用或执行取决于什么?准确地说,我有两个函数,它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
我目前正在使用 python 做一个机器学习项目(这里是初学者,从头开始学习一切)。 只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
在使用集成对象模型 (IOM) 后,我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇,使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示,但仍将高度添加到导航中以使其看起来好像要掉下来了。 这个脚本工作正常: $(document).ready(funct
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。 这里是 Java 新手,我正在使用 NetBeans 尝试一些简单的代
如果我将它切换到 Python 2.x,它执行 10。这是为什么? 训练逻辑回归模型 import keras.backend as
我有两个脚本,它们包含在 HTML 正文中。在第一个脚本中,我初始化一个 JS 对象,该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
每当我运行该方法时,我都会收到一个带有数字的错误 以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
我已经用 do~while(true) 创建了我的菜单;但是每次用户输入一个数字时,它不会运行程序,而是再次显示菜单!你怎么看? //我的主要方法 public static void main(St
执行命令后,如何让IPython通知我?我可以使用铃声/警报还是通过弹出窗口获取它?我正在OS X 10.8.5的iTerm上运行Anaconda。 最佳答案 使用最新版本的iTerm,您可以在she
您好,我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误,但 GUI 没有显示。这是我的源代码以供引用:
我觉得这里缺少明显的东西,但是我看不到它写在任何地方。 我使用Authenticode证书对可执行文件进行签名,但是当我开始学习有关它的更多信息时,我对原样的值(value)提出了质疑。 签名的exe
我正在设计一个应用程序,它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作,为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
我是 Haskell 新手,如果有人愿意帮助我,我会很高兴!我试图让这个程序与 do while 循环一起工作。 第二个 getLine 命令的结果被放入变量 goGlenn 中,如果 goGlenn
我有一个用 swing 实现迷你游戏的程序,在主类中我有一个循环,用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令,如果它是唯一的一条指令,我不知道为什么。
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序,它可以工作,但是当我尝试在 Windows 命令提示符中运行 .jar 时,
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行? 当如下行创
我有一个常见的情况,您有两个变量(xSpeed 和 ySpeed),当它们低于 minSpeed 时,我想将它们独立设置为零,并在它们都为零时退出。 最有效的方法是什么?目前我有两种方法(方法2更干净
我是一名优秀的程序员,十分优秀!