我正在研究运行时非常重要且我们正在处理的数据很大的事物,但是基本上,问题归结为优化对x的求解,其中x 1是已知的,并且x = ax + b来自上一行。因此,例如,开始状态:
a b x
1 2 3
3 1
2 2
4 8
1 9
最终状态如下所示:
a b x
1 2 3
3 1 5
2 2 16
4 8 72
1 9 81
因为3 * 1 + 2 = 5、5 * 3 + 1 = 16等
我尝试算出它的数学公式,最终得到了:
b0 = x1
xi = sum(n=0 to i-1)(bn*product(m=n+1 to i-1)(am)
因此,例如对于第三行,您最终得到:
x3 = a1*a2*b0 + b1*a2 + b2 = 3*1*3 + 2*3 + 1 = 9 + 6 + 1 = 16
但是在计算上,这似乎比仅通过遍历行来计算每个x更糟糕,像这样:
for i in range(2,len(df)):
df.x[i] = df.x[i-1]*df.a[i-1]+df.b[i-1]
有没有更简单的方法来解决我所缺少的问题,或者我只是在处理一个计算量大的操作,而我不得不承担迭代的费用?如果该术语不存在,则可以通过cumsum解决bn部分,例如:
df['b_cumsum'] = x1+cumsum(df.b)
但是当尝试包含这些术语时,我最终遇到了麻烦,尤其是因为我们最终甚至在每个总和术语中都需要这么多不同的产品集。
谢谢。
可以先计算出经重新缩放X:X '= X / cumprod(一个使用匹配)b =' b / cumprod(一)
可以使用向量化操作完成此操作,也可以使用从x '到x的反向转换:
ab = np.array([[1, 2],
[3, 1],
[2, 2],
[4, 8],
[1, 9]])
scale = ab.T[0].cumprod()
xp = 3+(ab.T[1]/scale).cumsum()
x = xp*scale
x
array([ 5., 16., 34., 144., 153.])
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句