成本函数依赖于时变LQR返回的K个矩阵的非线性系统的直接转录

Phil 发表于 Dev

菲尔

我正在努力实现一种名为DIRTREL的轨迹优化算法，该算法本质上是直接转录，具有附加的成本函数。但是，成本函数包含通过围绕决策变量（x，u）线性化系统并采用离散时变LQR获得的K个矩阵。我的问题是，由于Riccati差分方程的递归性质，当我当前的方法以符号方式描述该系统并导致极其冗长的符号方程时（只会随着更多的时间步长而增加长度），因此如何在drake中最有效，简洁地表达这一点，甚至这种象征性的方法是否合适。

更多细节：

将我的系统指定为LeafSystem
用决策变量x，u声明数学程序
要获取随时间变化的线性动力学，请指定一个类，该类在单个时间步上接受动力学和决策变量，并使用symbolic.Jacobian（args）返回该时间步的Jacobian
添加成本函数，该函数将吸收整个轨迹，因此所有x，u

成本函数内部：

通过使用接收决策变量并返回雅可比行列的类，获取每个时间步的线性化矩阵A_i，B_i，G_i（噪声为G_i）
使用Riccati差分方程，使用A_i和B_i矩阵并求解Ks，计算TVLQR成本（S [n]）
返回数学程序的成本，该成本实质上是K个矩阵的大型线性组合

旁注是我不确定以符号形式计算逆的最易处理的方法，但是我最关心的是我的方法论以及这种符号描述是否合适。

Hongkai Dai

我认为DIRTREL上有一些细节值得讨论：

S[n]待销成本矩阵取决于线性化动力学Ai, Bi。我认为在DIRTREL中，您将需要解决非线性优化问题，这需要成本的梯度。因此，要计算成本的梯度，您将需要的梯度S[n]，这需要的梯度Ai, Bi。由于Ai和Bi是动力学函数的梯度，因此f(x, u)您将需要计算动力学的二阶梯度。
我们发表了一篇关于进行轨迹优化和优化与LQR成本相关的成本函数的论文。DIRTREL对我们的论文进行了一些改进。在我们的实现中，我们S也将其视为决策变量，因此我们的决策变量x, u, S的约束条件包括动力学约束条件x[n+1] = f(x[n], u[n])和Riccati方程作为的约束条件S。我认为DIRTREL的方法可以用较少的决策变量更好地缩放，但是我没有比较这两种方法之间的数值性能。
我不确定为什么需要用符号来计算逆。首先，您需要计算什么逆数？其次，Drake支持使用自动微分来计算数值的梯度。我建议做数字计算而不是符号计算。由于在数值优化中，您只需要成本/约束的值和梯度，因此，用数字方式计算这些值通常要比先导出符号表达式然后评估符号表达式更为有效。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

成本函数依赖于时变LQR返回的K个矩阵的非线性系统的直接转录

成本函数依赖于时变LQR返回的K个矩阵的非线性系统的直接转录

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称