Linux内核中的内存屏障：理解内存序与并发

张开发

• 2026/7/1 14:28:42 • 15 分钟阅读

分享文章

Linux内核中的内存屏障理解内存序与并发作为一名深耕操作系统和嵌入式开发的工程师我对Linux内核中的内存屏障Memory Barrier机制有着深入的理解。内存屏障是并发编程中的关键概念它控制着编译器和CPU对内存操作的重新排序。为什么需要内存屏障现代CPU和编译器为了优化性能会对内存操作进行重新排序编译器重排序编译器优化时可能改变指令顺序CPU乱序执行CPU可能乱序执行指令以提高效率缓存一致性多核CPU的缓存一致性协议可能导致内存操作乱序内存屏障确保内存操作按照程序员的意图顺序执行。内存屏障的类型1. 编译器屏障// 防止编译器重排序 barrier(); // 或者使用volatile volatile int flag;2. CPU内存屏障// 通用内存屏障 mb(); // 全屏障确保之前的读写都完成 // 读屏障 rmb(); // 确保之前的读操作完成 // 写屏障 wmb(); // 确保之前的写操作完成 // 数据依赖屏障 data_access_barrier(); // 确保数据依赖关系3. 隐式内存屏障某些操作隐含内存屏障锁操作spin_lock/unlock, mutex_lock/unlock原子操作atomic_inc/dec/read/write睡眠/唤醒schedule, wake_up内存屏障的使用场景1. 双检锁Double-Checked Lockingstruct resource *g_resource; struct resource *get_resource(void) { struct resource *res; // 第一次检查无锁 res READ_ONCE(g_resource); if (likely(res)) return res; // 获取锁 spin_lock(resource_lock); // 第二次检查有锁 res g_resource; if (!res) { res create_resource(); // 写屏障确保resource初始化完成后再赋值 smp_wmb(); g_resource res; } spin_unlock(resource_lock); return res; }2. 生产者-消费者模式struct buffer { int data; int ready; }; // 生产者 void producer(struct buffer *buf, int value) { buf-data value; // 写屏障确保data写入后再设置ready smp_wmb(); buf-ready 1; } // 消费者 int consumer(struct buffer *buf) { // 读屏障确保先读ready再读data while (!READ_ONCE(buf-ready)) cpu_relax(); smp_rmb(); return buf-data; }3. RCU中的内存屏障// RCU读端 rcu_read_lock(); struct my_struct *ptr rcu_dereference(global_ptr); // data_access_barrier确保依赖关系 smp_read_barrier_depends(); // 使用ptr rcu_read_unlock(); // RCU写端 struct my_struct *new_ptr kmalloc(...); *new_ptr *old_ptr; new_ptr-field new_value; // 写屏障确保赋值前数据已准备好 smp_wmb(); rcu_assign_pointer(global_ptr, new_ptr);内存屏障的实现x86架构// x86有强内存序只需要编译器屏障 #define barrier() __asm__ __volatile__( ::: memory) // 全屏障使用mfence指令 #define mb() asm volatile(mfence ::: memory) // 读屏障x86读不会乱序 #define rmb() barrier() // 写屏障使用sfenceSSE2或lock指令 #define wmb() asm volatile(sfence ::: memory)ARM架构// ARM需要显式内存屏障指令 #define dmb() __asm__ __volatile__(dmb ::: memory) #define dsb() __asm__ __volatile__(dsb ::: memory) #define isb() __asm__ __volatile__(isb ::: memory) #define mb() dsb() #define rmb() dmb() #define wmb() dmb(st)常见陷阱1. 过度使用内存屏障// 错误不必要的内存屏障 mb(); x 1; mb(); y 2; mb(); // 正确只在需要的地方使用 x 1; smp_wmb(); y 2;2. 忘记配对使用// 错误只有写屏障没有读屏障 // 生产者 buf-data value; smp_wmb(); buf-ready 1; // 消费者 while (!buf-ready); // 缺少读屏障 return buf-data; // 正确配对使用 // 消费者 while (!READ_ONCE(buf-ready)) cpu_relax(); smp_rmb(); return buf-data;3. 依赖关系处理不当// 错误数据依赖需要特殊处理 struct node { int value; }; struct node *ptr global_ptr; // 可能先读取value再读取ptr int val ptr-value; // 正确使用data_access_barrier struct node *ptr rcu_dereference(global_ptr); smp_read_barrier_depends(); int val ptr-value;性能优化建议使用更弱的屏障如果只需要读或写屏障不要用全屏障利用原子操作的隐式屏障原子操作通常包含必要的屏障避免在热路径使用屏障屏障会影响CPU流水线使用READ_ONCE/WRITE_ONCE对于简单的标志位可能不需要完整屏障总结内存屏障是理解并发编程和内核开发的关键概念。作为嵌入式开发者正确使用内存屏障可以确保多核系统中的数据一致性同时避免不必要的性能损失。

更多文章

前端开发 2026/7/1 16:03:37

从CMOS Sensor原理到实战：深入浅出搞定工业相机中的Flicker Banding问题

从CMOS Sensor原理到实战：深入浅出搞定工业相机中的Flicker Banding问题在工业视觉检测系统中，图像质量直接决定了检测的准确性和可靠性。然而，许多工程师在实际部署中都会遇到一个令人头疼的问题——画面中出现周期性明暗条纹，这…

NSudo完全指南：轻松获取Windows最高权限的5种方法【免费下载链接】NSudo [Deprecated, work in progress alternative: https://github.com/M2Team/NanaRun] Series of System Administration Tools 项目地址: https://gitcode.com/gh_mirrors/ns/NSudo NSu…

张开发

前端开发 2026/7/2 0:48:42

第7章运算符-7.2 赋值运算符

赋值运算符用于将其右侧的值传递给左侧的变量（或常量）；也可以将右侧的值进行某些运算之后再传递给左侧的变量。表7-2中列出了Python中的赋值运算符，在该表中，假设变量a的值为3，变量b的值为2。表7-2 赋值运算…

张开发

Linux内核中的内存屏障：理解内存序与并发

最新文章

Windows Cleaner：免费开源工具，高效解决C盘空间不足问题

WarcraftHelper终极指南：魔兽争霸3全版本兼容性修复与性能优化完整方案

除了RTKLIB，还有哪些轻量级工具能一键把坐标序列转KML？实测3种方案对比

第四篇：Vibe Coding 深度解析（四）：生产级落地的工程化体系与避坑指南

python passlib

5分钟快速上手：xrdp开源远程桌面服务器完整配置指南

推荐文章

相关文章

分享文章

更多文章

从CMOS Sensor原理到实战：深入浅出搞定工业相机中的Flicker Banding问题

教育科技赋能自主学习：JiYuTrainer的平衡之道与效率提升方案

别再忍受龟速下载了！手把手教你为CentOS 7/8配置清华yum源（附一键脚本）

2026届学术党必备的六大AI辅助论文方案解析与推荐

新手必看：N76E003开发环境搭建全攻略（Keil C51+Nu-Link驱动）

C++并查集实战：从Wireless_Network到关押罪犯的5个经典问题解析

云原生环境中的DevOps实践

快马平台十分钟速建：基于gstack的现代博客原型开发全指南

飞轮储能背靠背变流器充放电控制并网控制 matlab/simulink仿真模型包括机侧...

ai人工智能笔记(二)

NSudo完全指南：轻松获取Windows最高权限的5种方法

第7章运算符-7.2 赋值运算符