- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个通过读取以下格式的 csv 数据创建的数据框
Date,Open,High,Low,Close,Volume,Adj Close,Ticker,Indicator1,Indicator2
42255,91.760002,92.790001,90.400002,92.720001,3085500,86.16844,LB,302.911961,45.621095920339
42251,88.550003,90.860001,88,90.379997,3230200,83.993779,LB,211.511385,45.7675721184876
42250,87.110001,90.769997,87.110001,89.279999,3989900,82.971506,LB,177.1386378,46.0213252964444
42255,65.82,66.790001,65.739998,66.769997,6397600,64.544698,DD,140.6188408,46.1284286660104
42251,30.559999,31.41,30.559999,31.4,13911700,31.4,EBAY,128.3615396,46.6328167692573
42250,64.279999,66.199997,64.279999,66.110001,6612700,63.906699,DD,111.3219234,47.1501954595785
42255,173.699997,177.410004,173.699997,177.279999,7107100,177.279999,BRK-B,103.1589082,48.0697637559109
42251,30.309999,30.860001,30.27,30.68,17892900,30.68,EBAY,100.6122268,48.3165158150696
42250,29.809999,30.559999,29.75,30.49,20272000,30.49,EBAY,94.75403852,49.066388420196
42255,84.68,86.010002,83.32,85.730003,3411000,79.672352,LB,88.39444803,50.0061610393543
42251,68.629997,70.099998,68.470001,69.910004,4018100,69.910004,AKAM,84.82357186,50.7093832981117
42250,28.870001,30.309999,28.790001,29.93,44959100,29.93,EBAY,80.94104725,51.6730513843059
42255,49.02,49.240002,47,47.650002,14153200,47.461114,DAL,78.71521075,51.6915087811999
42251,70.360001,74.75,70.360001,71.75,3296300,71.75,EVHC,78.54129955,51.9876960547054
我想在数据框中添加另一列,用于计算给定日期指标 1 的百分位数,即特定日期不同股票代码的所有值中的百分位数。
有人可以帮我解决 python 中需要的代码吗?我是Python新手。
最佳答案
IIUC:使用rank
方法。
print(df)
Date Open High Low Close Volume Adj Close Ticker Indicator1 Indicator2
0 42255 91.760002 92.790001 90.400002 92.720001 3085500 86.168440 LB 302.911961 45.621096
1 42251 88.550003 90.860001 88.000000 90.379997 3230200 83.993779 LB 211.511385 45.767572
2 42250 87.110001 90.769997 87.110001 89.279999 3989900 82.971506 LB 177.138638 46.021325
3 42255 65.820000 66.790001 65.739998 66.769997 6397600 64.544698 DD 140.618841 46.128429
4 42251 30.559999 31.410000 30.559999 31.400000 13911700 31.400000 EBAY 128.361540 46.632817
5 42250 64.279999 66.199997 64.279999 66.110001 6612700 63.906699 DD 111.321923 47.150195
6 42255 173.699997 177.410004 173.699997 177.279999 7107100 177.279999 BRK-B 103.158908 48.069764
7 42251 30.309999 30.860001 30.270000 30.680000 17892900 30.680000 EBAY 100.612227 48.316516
8 42250 29.809999 30.559999 29.750000 30.490000 20272000 30.490000 EBAY 94.754039 49.066388
9 42255 84.680000 86.010002 83.320000 85.730003 3411000 79.672352 LB 88.394448 50.006161
10 42251 68.629997 70.099998 68.470001 69.910004 4018100 69.910004 AKAM 84.823572 50.709383
11 42250 28.870001 30.309999 28.790001 29.930000 44959100 29.930000 EBAY 80.941047 51.673051
12 42255 49.020000 49.240002 47.000000 47.650002 14153200 47.461114 DAL 78.715211 51.691509
13 42251 70.360001 74.750000 70.360001 71.750000 3296300 71.750000 EVHC 78.541300 51.987696
df['Indicator1_percentile'] = df.Indicator1.rank(pct=True)
print(df['Indicator1_percentile']
0 1.000000
1 0.928571
2 0.857143
3 0.785714
4 0.714286
5 0.642857
6 0.571429
7 0.500000
8 0.428571
9 0.357143
10 0.285714
11 0.214286
12 0.142857
13 0.071429
Name: Indicator1, dtype: float64
关于python - 在 groupby 数据帧上使用 Scipy Percentileofscore,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43459609/
我在使用 cx_freeze 和 scipy 时无法编译 exe。特别是,我的脚本使用 from scipy.interpolate import griddata 构建过程似乎成功完成,但是当我尝试
是否可以通过函数在 scipy 中定义一个稀疏矩阵,而不是列出所有可能的值?在文档中,我看到可以通过以下方式创建稀疏矩阵 There are seven available sparse matrix
SciPy为非线性最小二乘问题提供了两种功能: optimize.leastsq()仅使用Levenberg-Marquardt算法。 optimize.least_squares()允许我们选择Le
SciPy 中的求解器能否处理复数值(即 x=x'+i*x")?我对使用 Nelder-Mead 类型的最小化函数特别感兴趣。我通常是 Matlab 用户,我知道 Matlab 没有复杂的求解器。如果
我有看起来像这样的数据集: position number_of_tag_at_this_position 3 4 8 6 13 25 23 12 我想对这个数据集应用三次样条插值来插值标签密度;为此
所以,我正在处理维基百科转储,以计算大约 5,700,000 个页面的页面排名。这些文件经过预处理,因此不是 XML 格式。 它们取自 http://haselgrove.id.au/wikipedi
Scipy 和 Numpy 返回归一化的特征向量。我正在尝试将这些向量用于物理应用程序,我需要它们不被标准化。 例如a = np.matrix('-3, 2; -1, 0') W,V = spl.ei
基于此处提供的解释 1 ,我正在尝试使用相同的想法来加速以下积分: import scipy.integrate as si from scipy.optimize import root, fsol
这很容易重新创建。 如果我的脚本 foo.py 是: import scipy 然后运行: python pyinstaller.py --onefile foo.py 当我启动 foo.exe 时,
我想在我的代码中使用 scipy.spatial.distance.cosine。如果我执行类似 import scipy.spatial 或 from scipy import spatial 的操
Numpy 有一个基本的 pxd,声明它的 c 接口(interface)到 cython。是否有用于 scipy 组件(尤其是 scipy.integrate.quadpack)的 pxd? 或者,
有人可以帮我处理 scipy.stats.chisquare 吗?我没有统计/数学背景,我正在使用来自 https://en.wikipedia.org/wiki/Chi-squared_test 的
我正在使用 scipy.odr 拟合数据与权重,但我不知道如何获得拟合优度或 R 平方的度量。有没有人对如何使用函数存储的输出获得此度量有建议? 最佳答案 res_var Output 的属性是所谓的
我刚刚下载了新的 python 3.8,我正在尝试使用以下方法安装 scipy 包: pip3.8 install scipy 但是构建失败并出现以下错误: **Failed to build sci
我有 my own triangulation algorithm它基于 Delaunay 条件和梯度创建三角剖分,使三角形与梯度对齐。 这是一个示例输出: 以上描述与问题无关,但对于上下文是必要的。
这是一个非常基本的问题,但我似乎找不到好的答案。 scipy 到底计算什么内容 scipy.stats.norm(50,10).pdf(45) 据我了解,平均值为 50、标准差为 10 的高斯中像 4
我正在使用 curve_fit 来拟合一阶动态系统的阶跃响应,以估计增益和时间常数。我使用两种方法。第一种方法是在时域中拟合从函数生成的曲线。 # define the first order dyn
让我们假设 x ~ Poisson(2.5);我想计算类似 E(x | x > 2) 的东西。 我认为这可以通过 .dist.expect 运算符来完成,即: D = stats.poisson(2.
我正在通过 OpenMDAO 使用 SLSQP 来解决优化问题。优化工作充分;最后的 SLSQP 输出如下: Optimization terminated successfully. (Exi
log( VA ) = gamma - (1/eta)log[alpha L ^(-eta) + 测试版 K ^(-eta)] 我试图用非线性最小二乘法估计上述函数。我为此使用了 3 个不同的包(Sc
我是一名优秀的程序员,十分优秀!