sas - 有效地将SAS中的三次样条拟合到特定的对象网格-6ren

sas - 有效地将SAS中的三次样条拟合到特定的对象网格

转载作者：行者123 更新时间：2023-12-04 20:53:38

我有一个包含以下变量的数据集 mydat:

我需要对这些元素进行三次样条拟合，其中 MNES 是对象 (X)，IV 是图像 (Y)。

我已经通过 PROC IML 成功地完成了我所需要的，但恐怕这不是最有效的解决方案。

具体来说，我的预期输出数据集是:

 mnes    iv
 0.333  0.40
 0.332  0.40  <- for mnes out of sample MNES range, copy first IV;
 0.336  0.40
 ...    ...
 0.834  0.40
 0.837  0.40
 0.840  0.40
 0.842  INTERPOLATION
 0.845  INTERPOLATION
 0.848  INTERPOLATION
 ...
 1.066  INTERPOLATION
 1.069  INTERPOLATION 
 1.072  INTERPOLATION
 1.074  0.18
 1.077  0.18  <- for mnes out of sample MNES range, copy last IV;
 1.080  0.18
 ...    ...
 3.000  0.18

必要的细节如下:

MNES 我总是有 1001 分，范围从 0.(3) 到 3(因此，每一步是 (3-1/3)/1000)。
IV 的插值只能用于最小和最大 MNES 之间的点。
对于MNES大于样本中最大MNES的点，IV应该等于IV 最大 MNES 和最小 MNES(它总是按 MNES 排序)。

我对效率的担心是因为我必须解决这个问题大约 200 万次，而现在(下面的代码，使用 PROC IML)处理 10 万个不同的输入数据集大约需要 5 个小时。

我的问题是:如果我希望在给定输入数据集(如上面的数据集)的情况下拟合三次样条并将其输出到特定对象网格，我有什么选择？什么解决方案最有效？

使用 PROC IML，我可以用 splinev function 做到这一点, 但我担心使用 PROC IML 不是最有效的方法；
对于 PROC EXPAND，考虑到这不是时间序列，它似乎不够。此外，我不知道如何通过 PROC EXPAND 指定我需要的对象网格；
使用 PROC TRANSREG，我不明白如何将数据集输入到结中，我不明白它是否会输出具有相应插值的数据集；
使用 MSPLINT 函数，它似乎可行，但我不知道如何将数据集输入到它的参数中。

我附上了我为此目的在下面使用的代码以及我正在做的事情的解释。阅读下面的内容对于回答问题不是必需的，但对于使用 PROC IML 解决此类问题或想要更好地理解我所说内容的人来说可能会有用。

我正在复制一种方法(Buss 和 Vilkov (2012))，除其他外，该方法将三次样条应用于这些元素，其中 MNES 是对象 (X)，IV 是图像 (Y)。

以下代码主要基于 Vilkov 为 Buss 和 Vilkov (2012) 编写的无模型隐含波动率 (MFIV) MATLAB 代码，available on his website .

插值法是一种通过计算 OTM 看跌期权和看涨期权价格来计算风险中性指标下股票返回波动率的方法。我将其用于我的硕士论文。此外，由于我的 PROC IML 版本没有用于 Black-Scholes 期权定价的函数，所以我定义了自己的函数。

proc iml;
    * Define BlackScholes call and put function;
    * Built-in not available in SAS/IML 9.3;
    * Reference http://www.lexjansen.com/wuss/1999/WUSS99039.pdf ;

    start blackcall(x,t,s,r,v,d);
        d1 = (log(s/x) + ((r-d) + 0.5#(v##2)) # t) / (v # sqrt(t));
        d2 = d1 - v # sqrt(t);
        bcall = s # exp(-d*t) # probnorm(d1) - x # exp(-r*t) # probnorm(d2);
        return (bcall);
    finish blackcall;

    start blackput(x,t,s,r,v,d);
        d1 = (log(s/x) + ((r-d) + 0.5#(v##2)) # t) / (v # sqrt(t));
        d2 = d1 - v # sqrt(t);
        bput = -s # exp(-d*t) # probnorm(-d1) + x # exp(-r*t) # probnorm(-d2);
        return (bput);
    finish blackput;

    store module=(blackcall blackput);
quit;

proc iml;
    * Specify necessary input parameters;
    currdate = "&currdate"d;
    currpermno = &currpermno;
    currsecid = &currsecid;
    rate = &currrate / 100;
    mat = &currdays / 365;
    * Use inputed dataset and convert to matrix;
    use optday;
    read all var{mnes impl_volatility};
    mydata = mnes || impl_volatility;

    * Load BlackScholes call and Put function;
    load module=(blackcall blackput);

    * Define parameters;
    k = 2;
    m = 500;

    * Define auxiliary variables according to Buss and Vilkov;
    u = (1+k)##(1/m);
    a = 2 * (u-1);

    * Define moneyness (ki) and implied volatility (vi) grids;
    mi = (-m:m);
    mi = mi`;
    ki = u##mi;

    * Preallocation of vi with 2*m+1 ones (1001 in the base case);
    vi = J(2*m+1,1,1);

    * Define IV below minimum MNESS equal to the IV of the minimum MNESS;
    h = loc(ki<=mydata[1,1]);
    vi[h,1] = mydata[1,2];

    * Define IV above maximum MNESS equal to the IV of the maximum MNESS;
    h = loc(ki>=mydata[nrow(mydata),1]);
    vi[h,1] = mydata[nrow(mydata),2];

    * Define MNES grid where there are IV from data;
    * (equal to where ki still has ones resulting from the preallocation);
    grid = ki[loc(vi=1),];

    * Call splinec to interpolate based on available data and obtain coefficients;
    * Use coefficients to create spline on grid and save on smoothFit;
    * Save smoothFit in correct vi elements;
    call splinec(fitted,coeff,endSlopes,mydata);
    smoothFit = splinev(coeff,grid);
    vi[loc(vi=1),1] = smoothFit[,2];

    * Define elements of mi corresponding to OTM calls (MNES >=1) and OTM puts (MNES <1); 
    ic = mi[loc(ki>=1)];
    ip = mi[loc(ki<1)];

    * Calculate call and put prices based on call and put module;
    calls = blackcall(ki[loc(ki>=1),1],mat,1,rate,vi[loc(ki>=1),1],0);
    puts = blackput(ki[loc(ki<1),1],mat,1,rate,vi[loc(ki<1),1],0);

    * Complete volatility calculation based on Buss and Vilkov;
    b1 = sum((1-(log(1+k)/m)#ic)#calls/u##ic);
    b2 = sum((1-(log(1+k)/m)#ip)#puts/u##ip);
    stddev = sqrt(a*(b1+b2)/mat);

    * Append to voldata dataset;
    edit voldata;
    append var{currdate currsecid currpermno mat stddev};
    close voldata;
quit;

最佳答案

好的。我将为 2 个数据集执行此操作，以帮助您了解您有很多数据集的事实。您将不得不修改您的输入，但这应该会给您带来更好的性能。

创建一些输入
从每个输入数据集中获取第一个和最后一个值。
创建所有 MNES 值的列表。
将每个输入合并到 MNES 列表中，并设置上限值和下限值。
将输入附加在一起
使用 BY 语句运行 PROC EXPAND 以单次传递所有输入值并创建样条曲线。

诀窍是“欺骗”EXPAND 认为 MNES 是每日时间序列。我通过使它成为一个整数来做到这一点——日期值是 SAS 幕后的整数。如果没有间隔，ETS 程序将采用“每日”频率。

完成此操作后，运行数据步骤以调用 Black-Scholes(BLKSHPTPRC、BLKSHCLPRC)函数并完成您的分析。

/*Sample Data*/
data input1;
input MNES    IV;
/*Make MNES and integer*/
MNES = MNES * 1000;
datalines;
 0.84  0.40
 0.89  0.34
 0.91  0.31
 0.93  0.29
 0.95  0.26
 0.98  0.23
 0.99  0.22
 1.00  0.22
 1.02  0.20
 1.04  0.18
 1.07  0.18
 ;
run;

data input2;
input MNES    IV;
MNES = MNES * 1000;
datalines;
 0.80  0.40
 0.9  0.34
 0.91  0.31
 0.93  0.29
 0.95  0.26
 0.98  0.23
 1.02  0.19
 1.04  0.18
 1.07  0.16
 ;
run;

/*Get the first and last values from the input data*/
data _null_;
set input1 end=last;
if _n_ = 1 then do;
    call symput("first1",mnes);
    call symput("first1_v",iv);
end;
if last then do;
    call symput("last1",mnes);
    call symput("last1_v",iv);
end;
run;

data _null_;
set input2 end=last;
if _n_ = 1 then do;
    call symput("first2",mnes);
    call symput("first2_v",iv);
end;
if last then do;
    call symput("last2",mnes);
    call symput("last2_v",iv);
end;
run;

/*A list of the MNES values*/
data points;
do mnes=333 to 3000;
    output;
end;
run;

/*Join Inputs to the values and set the lower and upper values*/
data input1;
merge points input1;
by mnes;
if mnes < &first1 then
    iv = &first1_v;
if mnes > &last1 then
    iv = &last1_v;

run;
data input2;
merge points input2;
by mnes;
if mnes < &first2 then
    iv = &first2_v;
if mnes > &last2 then
    iv = &last2_v;

run;

/*Append the data sets together, keep a value 
  so you can tell them apart*/
data toSpline;
set input1(in=ds1)
    input2(in=ds2);
if ds1 then
    Set=1;
else if ds2 then
    Set=2;
run;

/*PROC Expand for the spline.  The integer values
  for MNES makes it think these are "daily" data*/
proc expand data=toSpline out=outSpline method=spline;
by set;
id mnes;
run;

关于sas - 有效地将SAS中的三次样条拟合到特定的对象网格，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23483709/

文章推荐： xslt - 有人有 SourceForge 的 Xselerator XSL IDE 副本吗？

文章推荐： yesod - 面包屑如何工作？

嵌套函数的 Gnuplot 拟合
gnuplot 中拟合函数的正确方法是什么 f(x)有下一个表格吗？ f(x) = A*exp(x - B*f(x)) 我尝试使用以下方法将其拟合为任何其他函数: fit f(x) "data.txt
pytorch动态神经网络(拟合)实现
（1）首先要建立数据集 ? 1
r - 如何使用非线性函数拟合数据并绘制数据并使用 ggplot() 拟合
测量显示一个信号，其形式类似于具有偏移量和因子的平方根函数。如何找到系数并在一个图中绘制原始数据和拟合曲线？ require(ggplot2) require(nlmrt) # may be thi
r - 对正弦模型进行非线性最小二乘 (nls) 拟合
我想将以下函数拟合到我的数据中: f(x) = Offset+Amplitudesin(FrequencyT+Phase)，或根据 Wikipedia : f(x) = C+alphasin(ome
c# - 拟合 Akima 样条曲线
我正在尝试使用与此工具相同的方法在 C# 中拟合 Akima 样条曲线:https://www.mycurvefit.com/share/4ab90a5f-af5e-435e-9ce4-652c95c
javascript - 添加功能之前的 OpenLayers 拟合
问题:开放层适合 map ，只有在添加特征之后(视觉)，我该如何避免这种情况？我在做这个第 1 步 - 创建特征 var feature = new ol.Feature({...}); 第 2
javascript - 拟合 D3 图表的数据以创建图例
我有一个数据变量，其中包含以下内容: [Object { score="2.8", word="Blue"}, Object { score="2.8", word="Red"}, Objec
python - 拟合 RandomForestClassifier 时内存使用量激增
我正在尝试用中等大小的 numpy float 组来填充森林 In [3]: data.shape Out[3]: (401125, 5) [...] forest = forest.fit(data
matlab - 使用 lsqcurvefit 拟合
我想用洛伦兹函数拟合一些数据，但我发现当我使用不同数量级的参数时拟合会出现问题。这是我的洛伦兹函数: function [ value ] = lorentz( x,x0,gamma,amp )
matlab - 区分居中和缩放的 Polyfit 拟合
我有一些数据，我希望对其进行建模，以便能够在与数据相同的范围内获得相对准确的值。为此，我使用 polyfit 来拟合 6 阶多项式，由于我的 x 轴值，它建议我将其居中并缩放以获得更准确的拟合。但
python - 拟合 beta 二项式
我一直在寻找一种方法来使数据符合 beta 二项分布并估计 alpha 和 beta，类似于 VGAM 库中的 vglm 包的方式。我一直无法找到如何在 python 中执行此操作。有一个 scipy
numpy - 拟合 scipy.optimize 参数的错误
我将 scipy.optimize.minimize ( https://docs.scipy.org/doc/scipy/reference/tutorial/optimize.html ) 函数与
python - 拟合 Von Mises 分布的圆形直方图
在过去的几天里，我一直在尝试使用 python 绘制圆形数据，方法是构建一个范围从 0 到 2pi 的圆形直方图并拟合 Von Mises 分布。我真正想要实现的是: 具有拟合 Von-Mises 分
python - Keras 拟合 LSTM 在循环中变得更慢
我有一个简单的循环，它在每次迭代中都会创建一个 LSTM(具有相同的参数)并将其拟合到相同的数据。问题是迭代过程中需要越来越多的时间。 batch_size = 10 optimizer = opti
Python/Scipy kde 拟合、缩放
我有一个 Python 系列，我想为其直方图拟合密度。问题:是否有一种巧妙的方法可以使用 np.histogram() 中的值来实现此结果？ (请参阅下面的更新) 我目前的问题是，我执行的 kde 拟
python - 拟合 Keras L1 模型
我有一个简单的 keras 模型(正常套索线性模型)，其中输入被移动到单个“神经元”Dense(1, kernel_regularizer=l1(fdr))(input_layer) 但是权重从这个模
python - 拟合 sklearn GridSearchCV 模型
我正在尝试解决 Boston Dataset 上的回归问题在random forest regressor的帮助下.我用的是GridSearchCV用于选择最佳超参数。问题一我是否应该将 Grid
python - Python 中的交互式 BSpline 拟合
使用以下函数，可以在输入点 P 上拟合三次样条: def plotCurve(P): pts = np.vstack([P, P[0]]) x, y = pts.T i = np.aran
python - 拟合 3D 点 python
我有 python 代码可以生成数字 x、y 和 z 的三元组列表。我想使用 scipy curve_fit 来拟合 z= f(x,y)。这是一些无效的代码 A = [(19,20,24), (10,
r - 使用 fitdistrplus 拟合 Gumbel 分布
我正在尝试从 this answer 中复制代码，但是我在这样做时遇到了问题。我正在使用包 VGAM 中的gumbel 发行版和 fitdistrplus . 做的时候出现问题: fit = fi

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

sas - 有效地将SAS中的三次样条拟合到特定的对象网格