الزامات زیرساختی برای ساخت و استقرار هوش مصنوعی در مقیاس سازمانی
استفاده از دادههای مصنوعی برای ناشناسسازی مجموعههای دادهای حساس و یا ارائه پاسخهای سریع به سؤالات مربوط به مجموعههای دانشی خاص، نمونههایی از کاربردهای پیشرفته هوش مصنوعی در سطح سازمانی هستند که امروزه پیچیدهتر از همیشه شدهاند. آنچه همچنان ثابت مانده، الزامات زیرساختی است که این کاربردها بر پایه آنها ساخته میشوند. بدون زیرساخت مناسب، استقرار هوش مصنوعی در مقیاس سازمانی بسیار زمانبر، پرهزینه و منابعبر خواهد بود.
پشتهها (stack)ی مدرن که تحقق کاربردهای مقیاسپذیر یادگیری ماشین پیشرفته از طریق آنها ممکن میشود، شامل عناصر زیر هستند:
محاسبات (Compute): بسته به کاربرد خاص، نیازهای محاسباتی که ماهیت بلادرنگ بسیاری از برنامههای هوش مصنوعی—بهویژه برای کاربران نهایی—را پشتیبانی میکنند، معمولاً شامل «بار (لود) کاری توزیعشده بین تعداد زیادی GPU» هستند.
ذخیرهسازی (Storage): توانایی ذخیره حجم عظیمی از دادهها بهگونهای که بهسادگی و با سرعت بالا قابل دسترسی باشند، مکمل الزامات محاسباتی برای پشتیبانی از این کاربردها است.
عملکرد (Performance) : انتقال سریع دادهها از سیستم ذخیرهسازی به واحدهای محاسباتی، با استفاده از یک سیستم فایل واسط بهینه میشود. این سیستم فایل «دادهها را با سریعترین سرعت ممکن به GPUها منتقل میکند تا بتوانند پردازشهای هوش مصنوعی را پشتیبانی کنند.»
سازمانها میتوانند از راهکارهای مدرنی که هر سه عنصر فوق را برای توانمندسازی کاربردهای محاسبات شناختی فراهم میکنند، بهره ببرند. اتخاذ این راهکارها، «زیرساختی را برای پشتیبانی از بارکاری هوش مصنوعی، چه از نظر ذخیرهسازی، چه عملکرد و چه تراکم، فراهم میسازد.»
بهینهسازی عملکرد
بسیاری از سازمانها میدانند که گزینههای متنوعی برای انتخاب زیرساخت GPU و ذخیرهسازی در دسترس است. با این حال، پیادهسازیهای بهینه برای مواردی که تأخیر پایینی داشته باشند، به منابعی فراتر از این نیاز دارند. مشکل زیرساختهای ذخیرهسازی سنتی این است که سرعت کافی برای پشتیبانی از بارهای کاری بسیار موازی را ندارد. GPUها میتوانند اطلاعات را از سیستمهایی مانند NAS یا سیستمهای توزیعشده بخوانند، اما در نهایت GPU تبدیل به یک گلوگاه میشود و نمیتواند با کارایی و سرعت لازم عمل کند. کاربران میتوانند با استفاده از پلتفرمهایی که دارای «سیستم فایل موازی با عملکرد بالا» هستند، از این مشکلات اجتناب کنند. این سیستم برای به حداکثر رساندن عملکرد زیرساختهای محاسباتی و ذخیرهسازی طراحی شده است.
مزایای بهبود عملکرد
این رویکرد مزایای متعددی دارد:
حذف گلوگاه ذخیرهسازی: GPUها در این حالت میتوانند با کارایی 90 تا 95 درصد عمل کنند؛ در حالی که در سیستمهای سنتی این عدد حدود 40 درصد است.
پشتیبانی از بارهای کاری متنوع: این سیستم نهتنها از بارهای کاری تصادفی پشتیبانی میکند، بلکه قادر به مدیریت انواع مختلف بارهای کاری است؛ از جمله پیشبینی برای برنامههای کاربرمحور و فرآیندهای دادهمحور برای آمادهسازی مدلها.
افزایش کارایی منابع: این روش از نیاز به تخصیص منابع جداگانه برای آموزش یا تنظیم مدلها و منابع دیگری برای استنتاج جلوگیری میکند. جیسون هاردی، مدیر ارشد فناوری شرکت Hitachi Vantara در اینباره میگوید: «در حالت سنتی، شما منابع اختصاصی برای آموزش یا تنظیم مدل دارید و برای استنتاج از مجموعه منابع دیگری استفاده میکنید. اما حالا میتوانید از همان منابع برای هر دو استفاده کنید، زیرا زیرساخت ذخیرهسازی از هر دو فرآیند پشتیبانی میکند.»
ذخیرهسازی فلش (Flash storage)
عملکرد فوقالعادهای که از سیستم فایل موازی پیشتر مورد تاکید قرار گرفت، به عوامل متعددی بستگی دارد که یکی از مهمترین آنها استفاده از ذخیرهسازی پیشرفته فلش است. از یک سو، این سیستم فایل از فناوری PCIe نسل پنجم برای انتقال سریع دادهها بهره برده و از سوی دیگر، از ذخیرهسازی فلش نسل 5 با فرم فاکتور E3Sاستفاده میکند.
این ترکیب، سرعت بازیابی دادهها را به حدی میرساند که «در مقیاس نانوثانیه اندازهگیری میشود». هاردی در این زمینه اظهار میدارد: «از آنجا که مانند هارد دیسکهای سنتی دارای بخشهای چرخان نیست، میتوانیم بهطور همزمان بارکاری سنگین و عملیات ورودی/خروجی (IOPS) را انجام دهیم. هر دادهای را میتوان فوراً از روی این درایو فراخوانی کرد.»
ذخیرهسازی آبجکت (Object Storage)
ذخیرهسازی آبجکت یکی دیگر از جنبههای حیاتی زیرساخت ذخیرهسازی مورد نیاز برای استقرار هوش مصنوعی در مقیاس سازمانی است. این نوع ذخیرهسازی در مقایسه با ذخیرهسازی فلش هزینه کمتری دارد و در برخی محیطها بسیار مقرونبهصرفه است.
ذخیرهسازی آبجکت بهویژه برای مدیریت دادههای بدون ساختار و نیمهساختار یافتهای که سازمانها برای کاربردهای هوش مصنوعی به آنها متکی هستند، بسیار مناسب است. علاوه بر این، پلتفرمهای جامع زیرساخت هوش مصنوعی امکان تقسیمبندی هوشمند دادهها بین ذخیرهسازی فلش و ذخیرهسازی آبجکت را فراهم میکنند.
این قابلیت به سازمانها کمک میکند تا بین ذخیرهسازی بلندمدت دادهها با هزینه پایین و ذخیرهسازی گرانتر دادهها به گونهای که دسترسی سریع به آنها برای موارد استفاده هوش مصنوعی کاربرمحور و ضروری ممکن باشد، تعادل برقرار کنند.
ذخیرهسازی آبجکت برای موارد زیر مفید است:
- ایجاد اسنپشاتها (snapshots)
- پشتیبانگیری از دادهها
- تداوم کسبوکار
هاردی در این باره میگوید: «ما در داخل ذخیرهسازی آبجکت قابلیت حفاظت از تغییرناپذیری (immutability protection) داریم، بنابراین امکان دستکاری دادهها وجود ندارد. این دادهها به شیوهای ایمن نگهداری میشوند. اگر یک حمله باجافزاری به دادههای فعال شما رخ دهد، میتوانید آنها را از ذخیرهسازی آبجکت بازیابی کنید.»
ترکیب مناسب
الزامات زیرساختی که در بالا ذکر شد، تنها یکی از دو شرط اساسی برای پیادهسازی هوش مصنوعی در سازمانها است. سازمانهایی که به دنبال گزینههای جامع برای آموزش و اجرای مدلهای پیشرفته یادگیری ماشین هستند، بیشک به پردازندههای گرافیکی (GPUs)، ذخیرهسازی فلش و ابجکت و همچنین ساختارهای میانی، مانند سیستم فایل موازی با عملکرد بالا، نیاز خواهند داشت تا تعاملات میان این اجزا بهینه شود.
با این حال، «هاردی» هشدار میدهد که سازمانها باید یک ملاحظه دیگر را نیز در نظر بگیرند: توانایی تشخیص و دسترسی به دادههای صحیحی که برای برنامههای آنها بیشترین معنا را دارند. او میگوید: «شما باید استراتژی مدیریت داده مناسبی داشته باشید تا با ورود دادههای جدید به محیط، مدلهای شما—از طریق تنظیم دقیق (fine-tuning) یا روش RAG—اطمینان حاصل کنند که هنگام پرسش یا شروع یک فرآیند، جدیدترین نسخه اطلاعات را دریافت میکنید.»