داتا
منو موبایل

داتا

الزامات زیرساختی برای ساخت و استقرار هوش مصنوعی در مقیاس سازمانی

استفاده از داده‌های مصنوعی برای ناشناس‌سازی مجموعه‌های داده‌ای حساس و یا ارائه پاسخ‌های سریع به سؤالات مربوط به مجموعه‌های دانشی خاص، نمونه‌هایی از کاربردهای پیشرفته هوش مصنوعی در سطح سازمانی هستند که امروزه پیچیده‌تر از همیشه شده‌اند. آنچه همچنان ثابت مانده، الزامات زیرساختی است که این کاربردها بر پایه آن‌ها ساخته می‌شوند. بدون زیرساخت مناسب، استقرار هوش مصنوعی در مقیاس سازمانی بسیار زمان‌بر، پرهزینه و منابع‌بر خواهد بود.

پشته‌ها (stack)ی مدرن که تحقق کاربردهای مقیاس‌پذیر یادگیری ماشین پیشرفته از طریق آنها ممکن می‌شود، شامل عناصر زیر هستند:

محاسبات (Compute): بسته به کاربرد خاص، نیازهای محاسباتی که ماهیت بلادرنگ بسیاری از برنامه‌های هوش مصنوعی—به‌ویژه برای کاربران نهایی—را پشتیبانی می‌کنند، معمولاً شامل «بار (لود) کاری توزیع‌شده بین تعداد زیادی GPU» هستند.

ذخیره‌سازی (Storage): توانایی ذخیره حجم عظیمی از داده‌ها به‌گونه‌ای که به‌سادگی و با سرعت بالا قابل دسترسی باشند، مکمل الزامات محاسباتی برای پشتیبانی از این کاربردها است.

عملکرد (Performance) : انتقال سریع داده‌ها از سیستم ذخیره‌سازی به واحدهای محاسباتی، با استفاده از یک سیستم فایل واسط بهینه می‌شود. این سیستم فایل «داده‌ها را با سریع‌ترین سرعت ممکن به GPUها منتقل می‌کند تا بتوانند پردازش‌های هوش مصنوعی را پشتیبانی کنند.»

سازمان‌ها می‌توانند از راهکارهای مدرنی که هر سه عنصر فوق را برای توانمندسازی کاربردهای محاسبات شناختی فراهم می‌کنند، بهره ببرند. اتخاذ این راهکارها، «زیرساختی را برای پشتیبانی از بارکاری هوش مصنوعی، چه از نظر ذخیره‌سازی، چه عملکرد و چه تراکم، فراهم می‌سازد.»

بهینه‌سازی عملکرد

بسیاری از سازمان‌ها می‌دانند که گزینه‌های متنوعی برای انتخاب زیرساخت GPU و ذخیره‌سازی در دسترس است. با این حال، پیاده‌سازی‌های بهینه برای مواردی که تأخیر پایینی داشته باشند، به منابعی فراتر از این نیاز دارند. مشکل زیرساخت‌های ذخیره‌سازی سنتی این است که سرعت کافی برای پشتیبانی از بارهای کاری‌ بسیار موازی را ندارد. GPUها می‌توانند اطلاعات را از سیستم‌هایی مانند NAS یا سیستم‌های توزیع‌شده بخوانند، اما در نهایت GPU تبدیل به یک گلوگاه می‌شود و نمی‌تواند با کارایی و سرعت لازم عمل کند. کاربران می‌توانند با استفاده از پلتفرم‌هایی که دارای «سیستم فایل موازی با عملکرد بالا» هستند، از این مشکلات اجتناب کنند. این سیستم برای به حداکثر رساندن عملکرد زیرساخت‌های محاسباتی و ذخیره‌سازی طراحی شده است.

مزایای بهبود عملکرد

این رویکرد مزایای متعددی دارد

حذف گلوگاه ذخیره‌سازی: GPUها در این حالت می‌توانند با کارایی 90 تا 95 درصد عمل کنند؛ در حالی که در سیستم‌های سنتی این عدد حدود 40 درصد است.

پشتیبانی از بارهای کاری متنوع: این سیستم نه‌تنها از بارهای کاری تصادفی پشتیبانی می‌کند، بلکه قادر به مدیریت انواع مختلف بارهای کاری است؛ از جمله پیش‌بینی برای برنامه‌های کاربرمحور و فرآیندهای داده‌محور برای آماده‌سازی مدل‌ها.

افزایش کارایی منابع: این روش از نیاز به تخصیص منابع جداگانه برای آموزش یا تنظیم مدل‌ها و منابع دیگری برای استنتاج جلوگیری می‌کند. جیسون هاردی، مدیر ارشد فناوری شرکت Hitachi Vantara در اینباره می‌گوید: «در حالت سنتی، شما منابع اختصاصی برای آموزش یا تنظیم مدل دارید و برای استنتاج از مجموعه منابع دیگری استفاده می‌کنید. اما حالا می‌توانید از همان منابع برای هر دو استفاده کنید، زیرا زیرساخت ذخیره‌سازی از هر دو فرآیند پشتیبانی می‌کند.» 

ذخیره‌سازی فلش (Flash storage)

عملکرد فوق‌العاده‌ای که از سیستم فایل موازی پیشتر مورد تاکید قرار گرفت، به عوامل متعددی بستگی دارد که یکی از مهم‌ترین آن‌ها استفاده از ذخیره‌سازی پیشرفته فلش است. از یک سو، این سیستم فایل از فناوری PCIe نسل پنجم برای انتقال سریع داده‌ها بهره برده و از سوی دیگر، از ذخیره‌سازی فلش نسل 5 با فرم فاکتور E3Sاستفاده می‌کند.

این ترکیب، سرعت بازیابی داده‌ها را به حدی می‌رساند که «در مقیاس نانوثانیه اندازه‌گیری می‌شود».  هاردی در این زمینه اظهار می‌دارد: «از آنجا که مانند هارد دیسک‌های سنتی دارای بخش‌های چرخان نیست، می‌توانیم به‌طور هم‌زمان بارکاری سنگین و عملیات ورودی/خروجی (IOPS) را انجام دهیم. هر داده‌ای را می‌توان فوراً از روی این درایو فراخوانی کرد.»

ذخیره‌سازی آبجکت (Object Storage) 

ذخیره‌سازی آبجکت یکی دیگر از جنبه‌های حیاتی زیرساخت ذخیره‌سازی مورد نیاز برای استقرار هوش مصنوعی در مقیاس سازمانی است. این نوع ذخیره‌سازی در مقایسه با ذخیره‌سازی فلش هزینه کمتری دارد و در برخی محیط‌ها بسیار مقرون‌به‌صرفه است.

ذخیره‌سازی آبجکت به‌ویژه برای مدیریت داده‌های بدون ساختار و نیمه‌ساختار یافته‌ای که سازمان‌ها برای کاربردهای هوش مصنوعی به آن‌ها متکی هستند، بسیار مناسب است. علاوه بر این، پلتفرم‌های جامع زیرساخت هوش مصنوعی امکان تقسیم‌بندی هوشمند داده‌ها بین ذخیره‌سازی فلش و ذخیره‌سازی آبجکت را فراهم می‌کنند.

این قابلیت به سازمان‌ها کمک می‌کند تا بین ذخیره‌سازی بلندمدت داده‌ها با هزینه پایین و ذخیره‌سازی گران‌تر داده‌ها به گونه‌ای که دسترسی سریع به آنها برای موارد استفاده هوش مصنوعی کاربرمحور و ضروری ممکن باشد، تعادل برقرار کنند.

ذخیره‌سازی آبجکت برای موارد زیر مفید است:

  • ایجاد اسنپ‌شات‌ها (snapshots) 
  • پشتیبان‌گیری از داده‌ها 
  • تداوم کسب‌وکار 

هاردی در این باره می‌گوید: «ما در داخل ذخیره‌سازی آبجکت قابلیت حفاظت از تغییرناپذیری (immutability protection) داریم، بنابراین امکان دستکاری داده‌ها وجود ندارد. این داده‌ها به شیوه‌ای ایمن نگهداری می‌شوند. اگر یک حمله باج‌افزاری به داده‌های فعال شما رخ دهد، می‌توانید آن‌ها را از ذخیره‌سازی آبجکت بازیابی کنید.» 

ترکیب مناسب 

الزامات زیرساختی که در بالا ذکر شد، تنها یکی از دو شرط اساسی برای پیاده‌سازی هوش مصنوعی در سازمان‌ها است. سازمان‌هایی که به دنبال گزینه‌های جامع برای آموزش و اجرای مدل‌های پیشرفته یادگیری ماشین هستند، بی‌شک به پردازنده‌های گرافیکی (GPUs)، ذخیره‌سازی فلش و ابجکت و همچنین ساختارهای میانی، مانند سیستم فایل موازی با عملکرد بالا، نیاز خواهند داشت تا تعاملات میان این اجزا بهینه شود.

با این حال، «هاردی» هشدار می‌دهد که سازمان‌ها باید یک ملاحظه دیگر را نیز در نظر بگیرند: توانایی تشخیص و دسترسی به داده‌های صحیحی که برای برنامه‌های آن‌ها بیشترین معنا را دارند. او می‌گوید: «شما باید استراتژی مدیریت داده مناسبی داشته باشید تا با ورود داده‌های جدید به محیط، مدل‌های شما—از طریق تنظیم دقیق (fine-tuning) یا روش RAG—اطمینان حاصل کنند که هنگام پرسش یا شروع یک فرآیند، جدیدترین نسخه اطلاعات را دریافت می‌کنید.» 

منبع

مطالب مرتبط
۱۳ ترند هوش مصنوعی که آینده فناوری را شکل می‌دهند

۱۳ ترند هوش مصنوعی که آینده فناوری را شکل می‌دهند

بررسی تحولات سال‌های اخیر نشان می‌دهد که اکنون رهبری جریان نوآوری تا حدی زیادی در اختیار هوش مصنوعی و تحلیل‌های […]

11 دقیقه مطالعه مشاهده

پیشران‌هایی که فراگیری هوش‌مصنوعی و کلان‌داده را سرعت می‌بخشند

تسریع توسعه هوش مصنوعی و به‌کارگیری تحلیل‌های مبتنی بر کلان‌داده را باید مدیون چندین عامل دانست. عواملی که یا از […]

7 دقیقه مطالعه مشاهده

نیم‌نگاهی به وضعیت هوش مصنوعی در سال 2025

با ورود به سال 2025 و مشاهده روند توسعه صنایع، شاهد آنیم که یکپارچه شدن هوش مصنوعی و تحلیل‌های کلان‌داده […]

4 دقیقه مطالعه مشاهده

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *