خیلی اوقات مشکلات Performance نرمافزارها به ضعف یا مشکلات در شبکه نسبت داده میشوند و اتفاقاً Troubleshooting این دسته از مشکلات یکی از طاقتفرساترین کارها است. عموماً هم، کاربر یا توسعهدهندهی Application از کند بودن همهچیز گلایه دارند و خب دیواری کوتاهتر از شبکه وجود ندارد.
البته که در بسیاری از موارد نیز گره حل این مشکلات در شبکه میباشد، از طراحی و تتظیمات اشتباه گرفته، تا نیاز به بهینهسازی های اولیه. خیلی اوقات نیز عدم وجود پیشبینی و برنامهریزی از نیاز و ظرفیت شبکه (Capacity Planning/Management) باعث بروز چنین مشکلاتی در طول زمان میگردد.
چهت بررسی این دسته از مشکلات و اندازهگیری Performance، در کنار KPI های مرتبط با نرمافزار، روشها و ابزارهای متعددی نیز از دیدگاه شبکه وجود دارد مانند RTT بین دو node توسط ping time، تغییرات مسیر بین دو Node، میزان تغییرات زمان دریافت بستهها (Jitter)، میزان گذردهی شبکه (Throughput) و یا موارد اولیه مانند مقدار زمانی که طول میکشد تا یک اتفاق خاص صورت پذیرد. یکی دیگه از ابزارهای مهم در این زمینه نیز Capture کردن ترافیک و بررسی بسته ها در لایههای مختلف هست (توسط ابزارهایی مانند tcpdump، Wireshark و …)
اما در کنار تمام این ابزارهای ذکر شده و استفاده از آنها توأم با بروز بودن مستندسازی شبکه، نکتهی مهم دیگر مستندسازی و ثبت اندازهگیریها حین Troubleshooting میباشد که میتواند شامل درج ابزار استفاده شده، screenshot گرفتن، ذخیرهکردن Logها، و ثبت محل اندازهگیری و … باشد.
در این مطلب، یک نمونه سناریو Network Performance Troubleshooting و متدولوژی استفاده شده در دنیای واقعی بیان شده است که مطالعه آن پیشنهاد میشود.