在 docker 容器中运行的 Java（JDK8 更新 131 之前）应用程序 CPU/内存问题？

Vamsh 发表于 Dev

瓦姆什

在 docker 容器中运行的 JVM（更新 131 之前的 JDK 8）忽略了容器环境设置的 CGroup 限制。而且，他们查询的是主机资源，而不是分配给容器的资源。结果对 JVM 来说是灾难性的，即当 JVM 试图为自己分配比 CGroup 限制所允许的更多的资源（CPU 或内存）时，如果 java 程序是以 pid 1 运行。

内存问题的解决方案 -（可能在 JDK 8 更新 131 中修复）如上所述，JVM 分配给它自己的内存比容器允许的内存多。这可以通过以下方式轻松解决

-Xmx在启动 JVM 时显式设置最大堆内存限制（使用）。（131更新前）
或通过传递这些标志 - （在 131 更新后）
-XX:+UnlockExperimentalVMOptions和
-XX:+UseCGroupMemoryLimitForHeap

解决 CPU 问题（可能已在 JDK 更新 212 中修复）再次如上所述，在 docker 中运行的 JVM 将直接查看主机硬件并获取可用的 CPU 总数。然后它会尝试根据此 CPU 计数进行访问或优化。

在 JDK 8 更新 212 之后，在 docker 容器中运行的任何 JVM 将遵守分配给容器的 cpu 限制，而不是直接查看主机 cpu。如果一个具有 cpu 限制的容器如下启动，JVM 将尊重这个限制并将自身限制为 1 个 cpu。
docker run -ti --cpus 1 -m 1G openjdk:8u212-jdk//在这个容器中运行的jvm被限制为1cpu。
这是我的问题： CPU 问题可能在 JDK8 更新 212 中得到解决，但是如果我无法更新我的 JVM 并且我正在运行更新 131 之前的版本，我该如何解决 cpu 问题。

阿潘金

Linux 容器支持首先出现在 JDK 10 中，然后移植到 8u191，参见JDK-8146115。

早期版本的 JVM 获取可用 CPU 的数量如下。

在 8u121 之前，HotSpot JVM 依赖于sysconf(_SC_NPROCESSORS_ONLN)libc 调用。反过来，glibc 读取系统文件/sys/devices/system/cpu/online。因此，为了伪造可用 CPU 的数量，可以使用绑定安装替换此文件：
```
echo 0-3 > /tmp/online
docker run --cpus 4 -v /tmp/online:/sys/devices/system/cpu/online ...
```
要仅设置一个 CPU，请写入echo 0而不是echo 0-3
从 8u121 开始，JVM 就可以识别任务集了。取而代之的是sysconf，它开始调用sched_getaffinity以查找进程的 CPU 关联掩码。

这打破了绑定安装技巧。不幸的是，你不能sched_getaffinity像sysconf. 但是，可以sched_getaffinity使用LD_PRELOAD替换 libc 实现。

我写了一个小的共享库proccount来代替sysconf和sched_getaffinity。因此，该库可用于在 8u191 之前的所有 JDK 版本中设置正确的可用 CPU 数量。

这个怎么运作

首先，它读取cpu.cfs_quota_us并cpu.cfs_period_us查找容器是否使用--cpus选项启动。如果两者都大于零，则 CPU 的数量估计为
```
cpu.cfs_quota_us / cpu.cfs_period_us
```
否则，它会读取cpu.shares并估计可用 CPU 的数量为
```
cpu.shares / 1024
```
这种 CPU 计算类似于它在现代容器感知 JDK 中的实际工作方式。
该库定义（覆盖）sysconf和sched_getaffinity函数以返回在（1）或（2）中获得的处理器数量。

如何编译

gcc -O2 -fPIC -shared -olibproccount.so proccount.c -ldl

如何使用

LD_PRELOAD=/path/to/libproccount.so java <args>

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-15

我来说两句

0 条评论

登录后参与评论

上一篇：如果您可以在没有模板的情况下做同样的事情，那么 C++ 中的模板专业化有什么意义？

TOP 榜单

文章

在 docker 容器中运行的 Java（JDK8 更新 131 之前）应用程序 CPU/内存问题？

在 docker 容器中运行的 Java（JDK8 更新 131 之前）应用程序 CPU/内存问题？

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序