【一文秒懂】Linux内核态内存泄露检测工具 #

1、Kmemleak介绍 #

在Linux内核开发中，Kmemleak是一种用于检测内核中内存泄漏的工具。

内存泄漏指的是程序中已经不再使用的内存没有被妥善地释放，导致内存的浪费。内核中的内存泄漏同样会导致系统性能下降、系统崩溃等问题。

Kmemleak能够检测内核中的内存泄漏，通过检测内核中未被释放但又无法找到其使用位置的内存，进一步定位、修复内存泄漏的问题。

在用户空间，我们常用Valgrind来检测；
在内核空间，我们常用Kmemleak来检测。

2、如何使用Kmemleak #

2.1 内核配置 #

内核打开相应配置：

CONFIG_DEBUG_KMEMLEAK：Kmemleak被加入到内核
CONFIG_DEBUG_KMEMLEAK_EARLY_LOG_SIZE设置为16000：该参数为记录内存泄露信息的内存池，越大记录信息越多。
CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF ：Kmemleak默认开关状态

依赖的配置：

CONFIG_DEBUG_KERNEL：打开内核调试功能
CONFIG_DEBUG_FS：需要借助到debugfs
CONFIG_STACKTRACE：记录进程的堆栈信息

2.2 用户空间配置 #

我们要想使用Kmemleak，需要挂在debugfs，来查看泄露的情况。

进入文件系统后，进行挂载：

mount -t debugfs nodev /sys/kernel/debug/			#	挂在debugfs

设置扫描时间：

echo scan=10 > /sys/kernel/debug/kmemleak			#	10S扫描一次

默认内存泄露检测时间为10min，上面设置为10s一次

查看泄露情况：

cat /sys/kernel/debug/kmemleak						#	查看内存泄露情况

其他指令：

echo scan > /sys/kernel/debug/kmemleak		#触发一次扫描
echo clear > /sys/kernel/debug/kmemleak     #清除当前 kmemleak 记录的泄露信息
echo off > /sys/kernel/debug/kmemleak       #关闭kmemleak（不可逆转的）
echo stack=off > /sys/kernel/debug/kmemleak #关闭任务栈扫描
echo stack=on > /sys/kernel/debug/kmemleak  #使能任务栈扫描
echo scan=on > /sys/kernel/debug/kmemleak   #启动自动内存扫描线程
echo scan=off > /sys/kernel/debug/kmemleak  #停止自动内存扫描线程
echo scan=<secs> > /sys/kernel/debug/kmemleak#设置自动扫描线程扫描间隔，默认是600，设置0则是停止扫描
echo dump=<addr> > /sys/kernel/debug/kmemleak #dump某个地址的内存块信息，比如上面的echo dump=0xffffffc008efd200 > /sys/kernel/debug/kmemleak即可查看详细信息

2.3 通过Linux启动参数控制开关 #

Kmemleak的默认开关状态可以通过CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF 配置来控制，当然也可以通过向Linux内核启动参数中加入kmemleak=off来控制。

3、Kmemleak原理 #

Kmemleak提供了一种跟踪垃圾回收器tracing garbage collector的原理，来检测内核中存在的内存泄露，其不同之处在于：孤立的对象并没有被释放掉，而是通过/sys/kernel/debug/kmemleak仅仅被报告。

这种方法同样应用于Valgrind中，不过该工具主要用于检测用户空间不同应用的内存泄露情况。
在用户空间，我们常用Valgrind来检测应用进程；
在内核空间，我们常用Kmemleak来检测内核代码。

通过kmalloc()、vmalloc（）、kmem_cache_alloc()等函数分配内存时，会跟踪指针，堆栈等信息，将其存储在一个红黑树中。

同时跟踪相应的释放函数调用，并从kmemleak数据结构中删除指针。

简单理解：相当于追踪内存分配相关接口，记录分配内存的首地址，堆栈大小等信息，在内存释放阶段将其删除。

我们通过查看相关内核文档可知，内存泄露检测的扫描算法步骤如下：

将所有对象标记为白色（最后剩余的白色对象将被视为孤立对象）
从数据段和堆栈开始扫描内存，根据红黑树中存储的地址信息来检查值，如果找到指向白色对象的指针，则添加到灰色列表
扫描灰色列表以查找地址匹配的对象，直到灰色列表完成
剩下的白色对象被视为孤立对象，并通过/sys/kernel/debug/kmemleak进行报告

4、Kmemleak API接口 #

kmemleak_init - 初始化 kmemleak
kmemleak_alloc - 内存块分配通知
kmemleak_alloc_percpu - 通知 percpu 内存块分配
kmemleak_vmalloc - 通知 vmalloc() 内存分配
kmemleak_free - 通知内存块释放
kmemleak_free_part - 通知释放部分内存块
kmemleak_free_percpu - 通知 percpu 内存块释放
kmemleak_update_trace - 更新对象分配堆栈跟踪
kmemleak_not_leak - 将对象标记为非泄漏
kmemleak_ignore - 不扫描或报告对象泄漏
kmemleak_scan_area - 在内存块内添加扫描区域
kmemleak_no_scan - 不扫描内存块
kmemleak_erase - 擦除指针变量中的旧值
kmemleak_alloc_recursive - 作为kmemleak_alloc，但检查递归性
kmemleak_free_recursive - 作为kmemleak_free，但检查递归性

5、Kmemleak特殊情况 #

漏报：真正内存泄露了，但是未报告，因为在内存扫描期间找到的值指向此类对象。为了减少误报的数量，kmemleak提供了kmemleak_ignore，kmemleak_scan_area，kmemleak_no_scan和kmemleak_erase功能
误报：实际没有泄露，但是却错误的报告了内存泄露。kmemleak提供了kmemleak_not_leak功能。

6、Kmemleak验证 #

内核也提供了一个示例：kmemleak-test模块，该模块用以判断是否打开了Kmemleak功能。通过配置CONFIG_DEBUG_KMEMLEAK_TEST选项可以选择。

# modprobe kmemleak-test
# echo scan > /sys/kernel/debug/kmemleak

# cat /sys/kernel/debug/kmemleak
unreferenced object 0xffff89862ca702e8 (size 32):
  comm "modprobe", pid 2088, jiffies 4294680594 (age 375.486s)
  hex dump (first 32 bytes):
    6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b  kkkkkkkkkkkkkkkk
    6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b a5  kkkkkkkkkkkkkkk.
  backtrace:
    [<00000000e0a73ec7>] 0xffffffffc01d2036
    [<000000000c5d2a46>] do_one_initcall+0x41/0x1df
    [<0000000046db7e0a>] do_init_module+0x55/0x200
    [<00000000542b9814>] load_module+0x203c/0x2480
    [<00000000c2850256>] __do_sys_finit_module+0xba/0xe0
    [<000000006564e7ef>] do_syscall_64+0x43/0x110
    [<000000007c873fa6>] entry_SYSCALL_64_after_hwframe+0x44/0xa9
...

7、参考文章 #

内核官方文档：https://www.kernel.org/doc/html/latest/dev-tools/kmemleak.html
其他文章推荐：https://blog.csdn.net/weixin_41944449/article/details/123441820

欢迎关注【嵌入式艺术】，董哥原创！