Isilon: Pasangan node peer Gen6 DE (H400, A200, A2000) menghasilkan event dan pesan konsol yang menunjukkan masalah pada tautan NTB setelah penggantian atau pemindahan modul komputasi
Gejala
Pasangan node peer Gen6 DE (H400, A200, A2000) terkadang dapat mulai menghasilkan pesan kesalahan yang menunjukkan masalah pada tautan NTB. Kesalahan dapat mencakup pesan 'tautan NTB naik/turun' berulang serta kesalahan negosiasi kecepatan tautan, misalnya:
- mnv0: Peristiwa tautan HW turun
- mnv0: Peristiwa tautan HW naik
- mnv0: Gagal menegosiasikan kecepatan lajur PCIe; mengharapkan kecepatan 3 lajur, mendapatkan 2.
- mnv0: Tautan transport naik
- mnv0: Peer naik
Atau, log dan/atau konsol mungkin hanya menunjukkan tautan NTB dalam keadaan turun dan tidak naik. Saat ini tampaknya ada beberapa kemungkinan penyebab masalah ini, beberapa di antaranya masih dalam penyelidikan. Jika satu atau kedua node yang terkena dampak baru saja dipindahkan ke slot sasis yang berbeda, atau modul komputasinya diganti, masalah dan solusi yang didokumentasikan di KB ini mungkin berlaku. Masalah ini tidak memengaruhi node EP (F800, H600, H500).
Penyebab
Node peer berkomunikasi satu sama lain melalui saluran komunikasi khusus yang disebut NonTransparent Bridge (NTB) yang tertanam di backplane sasis. Dalam operasi normal, kedua node dalam pasangan peer harus memiliki nilai PPD yang berbeda untuk dapat berkomunikasi satu sama lain melalui NTB. Nilai PPD ditetapkan berdasarkan ID slot node di sasis. Masalah ini disebabkan oleh BIOS node yang mempertahankan ID slot lama node saat node atau modul komputasi dipindahkan ke slot yang berbeda dari asalnya, alih-alih mendeteksi ID slot baru. Hal ini dapat menyebabkan nilai PPD diatur secara tidak benar, yang menyebabkan konflik yang mencegah node membuat tautan NTB.
Solusi
Jalankan perintah berikut pada kedua node dalam pasangan peer yang terkena dampak untuk memverifikasi apakah masalah yang didokumentasikan di KB ini berlaku:
# sysctl dev_hw.0_info.ppd
Setiap node akan merespons dengan salah satu dari:
dev_hw.0_info.ppd: 73
Atau:
dev_hw.0_info.ppd: 93
- Jika satu node dalam pasangan merespons dengan 73 dan yang lainnya merespons dengan 93, node-node tersebut tidak terpengaruh oleh masalah yang didokumentasikan di KB ini. Harap hubungi Dukungan Teknis untuk bantuan lebih lanjut.
- Jika kedua node merespons dengan nomor yang sama, baik 73 atau 93, mereka terpengaruh oleh masalah yang didokumentasikan di KB ini. Masalah ini diselesaikan dalam firmware node yang diperbarui yang disertakan dalam Paket Firmware Node 10.1.6 dan yang lebih baru, serta dalam perbaikan kode yang disertakan dalam OneFS 8.1.0.4 dan yang lebih baru. Meskipun setiap pembaruan secara individual akan memperbaiki masalah tersebut, kedua rilis tersebut mengandung perbaikan penting lainnya, sehingga disarankan untuk menginstal keduanya.
Produk Terkena Dampak
Isilon, Isilon Gen6
Platform Lainnya
Berita Piala Dunia
Jika Anda memiliki pertanyaan, silakan kirim email ke [email protected]