关于linux系统上软中断只用到一个cpu的问题
有些网卡的中断没有用到多个cpu,只用到一个CPU,导致那个cpu的软中断是100%,系统缓慢。
[root@web ~]# cat /proc/interrupts
CPU0       CPU1      
0:  939474003          0    IO-APIC-edge  timer
1:          7          2    IO-APIC-edge  i8042
6:          2          3    IO-APIC-edge  floppy
7:          0          0    IO-APIC-edge  parport0
8:          1          0    IO-APIC-edge  rtc
9:          0          0   IO-APIC-level  acpi
12:          0        116    IO-APIC-edge  i8042
15:   47539568      94428    IO-APIC-edge  ide1
51:    4557238      12181   IO-APIC-level  ioc0
59:          0          0   IO-APIC-level  vmci
75:  101314205          0         PCI-MSI  eth0
NMI:          0          0
LOC:  998113903  999592029
ERR:          0
MIS:          0
可以看到eth0只用到了cpu0,加外mpstat -P ALL 1和top中的si也可以查看cpu中断的使用情况。
解决这个问题,有两个办法:
- 用irqbalance服务
 
irqbalance针对多核以及超线程采用共享缓存的系统只处理一次设备中断均衡,也即以静态方式分配各设备中断对应的CPU。在双核及单核系统中启动irqbalance,并不会影响系统资源,因为irqbalance在做完中断均衡相关判断、处理后即退出。
centos上自带了irqbanlance,安装上
chkconfig –level 345 irqbalance on
service irqbalance start
就行了。
当然这个办法不是最好的办法。irqbalance仅是一个通用方案,而不是最佳方案。
- 修改内核参数
/proc/irq/irq#/smp_affinity 
[root@archimedes /proc]# cat /proc/irq/75/smp_affinity
00000001
表示eth0只用到了第一个cpu,可以修改这个参数,使它使用多个cpu。
参数:
Binary       Hex
CPU 0    0001         1
CPU 1    0010         2
CPU 2    0100         4
CPU 3    1000         8
参数是一个10进制的值,cpu n == 2 的 n 次方。
如果用cpu0和cpu2:
Binary       Hex
CPU 0    0001         1
+ CPU 2    0100         4
———————–
both     0101         5
全用:
Binary       Hex
CPU 0    0001         1
CPU 1    0010         2
CPU 2    0100         4
+ CPU 3    1000         8
———————–
both     1111         f
修改:
echo f > /proc/irq/75/smp_affinity
需要注意的是:
有些网卡在PCI-MSI模式下修改这个参数不起作用,需要在内核启动时加上pci=nomsi参数。网上看主要是Broadcom的网卡有这个问题。