NSX-T 複数の宛先フローキャッシュの問題が原因で、ESXiホストがPSODでクラッシュ

複数の宛先フローキャッシュの問題NSX-T(82611)が原因で、ESXiホストがPSODでクラッシュするという事象があるそうです。かなり危険な状態になります。

 

情報元はこちら。

 

複数の宛先フローキャッシュの問題NSX-T(82611)が原因で、ESXiホストがPSODでクラッシュする

https://kb.vmware.com/s/article/82611?lang=en_US

 

 

症状
PSODは、ワールドxxxx:vmnic5-pollWIPでPF例外14で発生しました
ESXi var / log / vmkernel.logには、次のようなエントリが表示されます。

 

#0 BitVector_NextBit (bv=0x45a57a1ff940, startSearch=17829, state=1 '\001', pos=0x451b1291b9b8) at bora/lib/misc/bitvector.c:256
#1 0x000041802da39818 in vmk_BitVectorNextBit (vmkbv=<optimized out>, startSearch=<optimized out>, state=state@entry=1 '\001', pos=pos@entry=0x451b1291b9b8) at bora/vmkernel/core/vmkapi_bitvector.c:136
#2 0x000041802f42715b in FCPortsBitmapGet (nthSetBit=1, portsBitmap=0x45a57a9fe8c0) at /build/mts/release/bora-15314311/nsx/datapath/esx/modules/fc/fc.h:674
#3 FC_ForwardFastpathPktList (ps=0x43063f1a8000, dispatchData=dispatchData@entry=0x45a57a9fe880, nresumed=0x451b1291bb88) at /build/mts/release/bora-15314311/nsx/datapath/esx/modules/fc/fc_datapath.c:583
#4 0x000041802f42a1b1 in FC_LookupInput (portID=<optimized out>, arg=..., pktList=pktList@entry=0x430151444d00, iocHandle=iocHandle@entry=0x4303264fb020)
    at /build/mts/release/bora-15314311/nsx/datapath/esx/modules/fc/fc_datapath.c:1960
#5 0x000041802dbf72fa in IOChain_Resume (port=port@entry=0x43063f1deb00, chain=chain@entry=0x43063f1dedd8, prevLink=prevLink@entry=0x0, pktList=pktList@entry=0x430151444d00,
    remainingPktList=remainingPktList@entry=0x0) at bora/vmkernel/net/iochain.c:825
#6 0x000041802dc34bf1 in Port_InputResume (port=0x43063f1deb00, prev=prev@entry=0x0, pktList=pktList@entry=0x430151444d00) at bora/vmkernel/net/port.c:3602
#7 0x000041802dc34d20 in Port_Input (port=<optimized out>, pktList=pktList@entry=0x430151444d00) at bora/vmkernel/net/port.c:2426
#8 0x000041802dbcef23 in Net_AcceptRxList (dev=0x4306a4256f00, list=0x430151444d00) at bora/vmkernel/net/bh.c:1055
#9 0x000041802dc69072 in vmk_PktListRxProcess (pktlist=<optimized out>, uplink=<optimized out>) at bora/vmkernel/net/vmkapi_net_uplink.c:567
#10 0x000041802dc60360 in NetPollWorldCallback (data=0x430151444c40) at bora/vmkernel/net/vmkapi_net_poll.c:494
#11 0x000041802dd0e323 in CpuSched_StartWorld (destWorld=<optimized out>, previous=<optimized out>) at bora/vmkernel/sched/cpusched.c:11952
#12 0x0000000000000000 in ?? ()

 

 

原因
PSODは、複数の宛先パケットの処理で発生します。


 解決方法
このバグの修正は、NSX-T(バージョン3.2)に含まれています。


回避策
複数の宛先フローキャッシュを無効にするには

 

手順:

各ESXホストで、  「/etc/vmware/nsx/nsx-cfgAgent.xml:」を編集します:


<flowCache>
   <enabled>true</enabled>
   <mcastEnabled>false</mcastEnabled>
</flowCache>

netcpaサービスの再起動:


/etc/init.d/netcpad restart


 関連情報
フローキャッシュは、パケット変更アクションをキャッシュし、それらを同じストリーム内の後続のパケットに適用することにより、パケット処理を促進するのに役立ちます。回避策は、ブロードキャスト/マルチキャストトラフィックのフローキャッシュを無効にします。これらのタイプのトラフィックは、フローキャッシュなしで通常のデータパス処理を通過します。

 

Anker PowerCore Fusion 5000 (モバイルバッテリー 搭載 USB充電器 5000mAh) 【PSE技術基準適合/コンセント 一体型/PowerIQ搭載/折りたたみ式プラグ】 iPhone iPad Android各種対応 (ブラック)