عنوان فارسی مقاله: |
الگوریتم LSQR بهینه شده موازی برای توموگرافی ارتعاشی |
عنوان انگلیسی مقاله: |
An optimized parallel LSQR algorithm for seismic tomography |
چکیده
الگوریتم ایجاد شده توسط پیج و ساندرز (1982) به عنوان یکی از کارآمدترین و پایدارترین روشهای حل سیستم های خطی بزرگ، پراکنده و مشکل دار محسوب می شود. در توموگرافی ارتعاشی، روش LSQR به صورت گسترده در حل مسائل وارون سازی (اینورسیون) خطی شده استفاده می شود. با افزایش بررسی های ارتعاشی و پیشرفت روش های توموگرافیک، اندازه ی مسائل وارون سازی می تواند متعاقب آن رشد کند. هم اکنون، چند حل کننده ی LSQR موازی ارائه شده اند یا برای حل مسائل بزرگ بر روی سوپرکامپیوترها موجود می باشند اما قابلیت قیاس پذیری آنها معمولا ضعیف است چون در میان پردازنده ها هزینه ی ارتباط بالا است. در این مقاله، ما جزئیات بهینه سازی بر روی کد LSQR را برای وارون سازی توموگرافیک ارتعاشی ارائه می کنیم. بهینه سازی هایی که ما برای کد LSQR اجرا کرده ایم به عبارت روبرو می باشند: ترتیب مجدد ماتریس میرایی برای کاهش پهنای باند آن به منظور ساده کردن الگوی ارتباطی و کاهش میزان ارتباطات در حین محاسبات، اتخاذ فرمت های ذخیره ی ماتریس پراکنده برای ذخیره سازی کارآمد و ماتریس های پارتیشن بندی؛ استفاده از توابع MPI I/O برای موازی کردن تاریخ خوانش و فرآیندهای نوشتن نهایی؛ فراهم کردن استراتژی های مختلف برای پارتیشن داده به منظور استفاده ی موثر از منابع محاسباتی. یک مسئله ی وارون سازی توموگرافی ارتعاشی، توموگرافی موجی سه بُعدی کامل برای جنوب کالیفرنیا، برای توضیح جزئیات بهینه سازی های ما و ارزیابی عملکرد سوپرکامپیوتر Yellowstone در مرکز سوپرمحاسبات NCAR-Wyoming (NWSC) مورد استفاده قرار گرفت. نتایج نشان دادند که وال تایم کد ما برای مسئله ی وارونه سازی مشابه بسیار کمتر از زمان حل کننده ی LSQR از مخزن PETSc می باشد.