نبرد متخصصان و ماشین در زمین «تحلیل داده»
هوش مصنوعی هر روز در حال فتح حوزههای جدید است؛ در ادامه دستاوردهایی که این فناوری در تولید انواع مختلف محتوا (مانند تصاویر گرافیکی، ویدئو و مقالات متنی) بدون نیاز به داشتن تخصص و مهارت ویژه داشته، حالا زمزمههایی از ورود آن به حوزه برنامهنویسی و تحلیل داده به گوش میرسد. علی گلزاده، مدیرعامل داتا، در یادداشتی که به تازگی در شماره 86 ماهنامه عصر تراکنش به چاپ رسیده، تلاش کرده تا کلیاتی از تاثیرات هوشمندسازی این حوزه را مورد بررسی قرار دهد. متن این یادداشت را میتوانید در ادامه بخوانید:
مدتهاست که در محافل مختلف بحث ارزشمندی دادهها برای سازمانها داغ است. با اینوجود چنانچه سازمان قادر به استخراج بینش از داده نباشد، داشتن آن چندان ارزشی ندارد و مزیتی برای آن کسبوکار ایجاد نخواهد کرد. ناتوانی در جمعآوری دانش از دادهها، بسیاری از کسبوکارها را به تلاش برای کشف روشی برای استفاده مؤثر از دادهها واداشته است. اساساً سازمانها برای شکوفا کردن پتانسیلهای داده و انتفاع از آنها، به مداخله متخصصان داده نیاز دارند؛ با این وجود به نظر میرسد با فناوری تجزیهوتحلیل افزوده (augmented analytics) ماجرا کمی متفاوت باشد.
تجزیهوتحلیل افزوده فرایندی است که در آن جمعآوری داده بهصورت خودکار از منابع دادهای انجام میشود؛ این دادهها به صورت هوشمند تمیز شده و با روشهای عاری از سوگیری تحلیل میشوند؛ سپس به کمک پردازش زبان طبیعی (NLP) گزارشهایی ایجاد شده و به مخاطب منتقل میشود. به لطف یادگیری ماشین، تجزیهوتحلیلهای افزوده بدون کمکگرفتن از متخصصان داده، به جستجوی الگوها و یا بینشهای ارزشمند دیگر در دل دادهها میپردازند. نکتهای که باید مورد توجه قرار داد آن است که حتی با فراگیری تجزیهوتحلیل افزوده و انطباق سازمانها با آن، باز هم تقاضا برای تحلیلگران داده بالا خواهد بود. همانطور که از نام این فناوری برمیآید، این برنامه مبتنی بر هوش مصنوعی، با خودکارسازی انجام بسیاری از کارهای تکراری مانند جمعآوری و آمادهسازی داده، به تقویت تلاشهای انسانی میپردازد و زمان تحلیلگران داده را برای داشتن عملکردی خلاقانه و راهبردیتر، مانند طرح سؤالات کسبوکاری بهتر و یافتن منابع دادهای نوآورانه آزاد میکند.
مهمترین بخشهای این فناوری در ادامه توضیح داده میشوند:
جمعآوری و آمادهسازی داده: پتانسیلهای هوش مصنوعی باعث میشود که با خودکارسازی امور، فرایند جمعآوری و آمادهسازی دادهها از منابع مختلف بسیار سادهتر شود. به لطف الگوریتمهای هوش مصنوعی، حالا امکان بررسی دقیق مجموعههای عظیمداده برای عاری بودن از خطاها و ناپیوستگیها و همچنین شناسایی ویژگیهای خاص درون دادههایی مانند دادههای شخصی، فراهم شده است.
کشف و مصورسازی داده: بهکارگیری الگوریتمهای پیچیده برای تحلیل و مصورسازی، باعث میشود که فرایندهای کشف، استخراج و نمایش دادهها بهبود پیدا کند. روشهای هوش مصنوعی شامل خوشهبندی و کشف ناهنجاریها، به شناسایی الگوها و ناهنجاریهای نهفته در دل دادهها کمک میکند. ابزارهای مصورسازی مبتنی بر هوش مصنوعی، امکان ایجاد تصاویر تعاملی و کاربرپسند را فراهم میکنند که چنین امری به کاربر امکان میدهد بتواند بهگونهای بسیار مؤثرتر مجموعهدادههای پیچیده را بررسی کرده و بتواند اقدامات عملی مناسب را برنامهریزی کند.
یادگیری ماشین و تحلیلهای آماری: یادگیری ماشین یکی از زیرشاخههای هوش مصنوعی است که فرایند ساخت مدلهای پیشبینیگر را خودکارسازی میکند. این فناوری این امکان را فراهم میکند که مدلها بتوانند از دادههای تاریخی موجود یاد بگیرند، الگوها را تشخیص دهند و با کمترین دخالت انسانی بتوانند پیشبینی یا تصمیمگیری کنند. ابزارهای تجزیهوتحلیل افزوده، قابلیتهای یادگیری ماشین خودکار (AutoML) را فعال میکنند و بدون نیاز به آموزشهای اضافی، خلق مدلهای شخصیسازی شده یادگیری ماشین را تسهیل میکنند.
پردازش زبان طبیعی (NLP) و تولید زبان طبیعی (NLG): پردازش زبان طبیعی در تحلیلهای دادهای نقشی چندوجهی دارد که ابهامات زبانی را رفع کرده، دادهها را ساختاربندی میکند و ارتباط میان کاربران و کامپیوترها را برای اموری مانند خواندن، تشخیص و تحلیلها تسهیل میکند. این مسئله ارائه پاسخهای فوری و منسجم از طریق تولید زبان طبیعی را ممکن میکند. افزون بر این، پردازش زبان طبیعی با استخراج حقایق و ارتباطات حیاتی و خلاصهسازی حجم انبوهی از دادههای متنی و انجام تحلیلها از اقدامات نیز پشتیبانی میکند. تولید زبان طبیعی نیز با قدرتمند کردن ابزارهای تحلیلی که امکان ارائه پاسخهای قابلدرک و تولید گزارش به زبان انسانی فراهم میکند، به تکمیل این قابلیتها میپردازد.
مزایای تجزیهوتحلیل افزوده عبارتاند از:
- آزادشدن زمان متخصصان داده برای تمرکز بر موضوعات استراتژیک و موضوعات خاص
- از آنجا که ماشینها توانایی تحلیل بهینه تعداد بیشماری از منابع دادهای و ترکیب آنها را دارا هستند، امکان انجام تحلیلهای عمیقتر را فراهم میکند.
- با سادهکردن کار تحلیل داده، استفاده از آن را برای رسیدن به بینشهای عملی میسر میکند.
- تعداد بیشتری از نیروهای سازمان بر داده متمرکز میشوند و با تبدیل استفاده از دادهها به امری روزمره، استفاده از این سرمایه ارزشمند را از انحصار متخصصان داده خارج میکند.
- آمادهسازی داده با سرعت بیشتری انجام میشود و تحلیل و مصورسازی داده نیز بهگونهای مؤثرتر پیش برده میشود.
- به کشف بینشهایی میانجامد که شاید کاربر فکرش را نیز نمیکرد.
- با نمایش خودکار بینشها، ارائه توصیهها و توانمندسازی همه کاربران برای تعامل با دادههایشان، سواد داده ارتقا پیدا میکند.