کلان داده

کلان داده (داده‌های بزرگ/داده‌های عظیم) یک اصطلاح در حوزه فن آوری اطلاعات است که به منظور توصیف حجم بالای اطلاعات ساخت یافته و غیر ساخت یافته استفاده می‌شود و به منظور تحلیل‌های مختلف و تصمیمات هوشمند در جهت بهبود کسب و کار شرکت‌ها و سازمان‌ها مورد استفاده قرار می‌گیرد. 

کلان داده (داده‌های بزرگ) در تمام لحظات و در اطراف ما در حال تولید است. هر پردازش الکترونیکی و نرم افزار کاربردی و اجتماعی در حال تولید آن است. سیستم‌ها، سسنورها و گوشی موبایل ابزارهای انتقال آن بوده و شامل داده‌ها از منابع مختلفی است که حجم، تنوع و نرخ تولید بالایی داشته باشند. با توجه به حجم بالا و نرخ رشد زیاد، در کنار تنوع اطلاعاتی باید با تکنولوژی و زیر ساخت‌های متفاوتی نگهداری و پردازش و تحلیل شود.

مقایسه با انبار داده

مقایسه کلان داده (داده‌های بزرگ) با انبار داده‌ها مقایسه سیب با پرتقال است به این معنی که از لحاظ فلسفه مقایسه‌ای معقول است زیرا هر دو نگهداری و پردازش اطلاعات و تحلیل اطلاعات را دنبال می‌کنند. ولی در حجم اطلاعات عظیم (از چند ده میلیارد رکورد به  بالا) هزینه و روش نگهداری در انبار داده بسیار گزاف است ودر کنار این که مدل طراحی و نگهداری اطلاعات در انبار داده بر اساس مارت‌های اطلاعاتی تعریف شده که با مدل نگهداری اطلاعات در داده‌های بزرگ (کلان داده) متفاوت است. در واقع انبار داده‌های کارکردهای خود را دارا است ولی مباحث انتقال انبارداده‌ها بر روی معماری کلان داده (داده عظیم) از مباحث مطرح حوزه دیتا می‌باشد که قابل تامل است.

معماری و Framework

نکته مهم این است که اصطلاح کلان داده (داده‌های بزرگ) لزوماً به معنی حجم بالای اطلاعات نبوده و به تکنولوژی‌ها و حتی سازمان‌هایی که ابزارها، تکنیک‌ها و امکانات ذخیره و بازیابی حجم بالای اطلاعات را دارا هستند نیز خطاب می‌شود. معماری اولیه و پایه کلان داده (داده‌های بزرگ) Hadoop نام دارد که معماری فایل‌های توزیع شده است که به صورت متن باز بوده و توسط شرکت‌های مختلف از جمله گوگل و فیس بوک توسعه داده شده و به صورت نسخه‌ها و ابزارهای اختصاصی بهره برداری می‌شود. در ۱۰ سال گذشته و بعد از ارائه این معماری، این معماری هم در حوزه‌های متن باز و هم به صورت شرکت‌هایی که آن را تجاری کرده‌اند توسعه پیدا نموده است و ابزارها و روش‌های مختلفی روی آن ایجاد شده است.

تحلیل کلان داده (داده عظیم)

وقتی بحث داده‌های عظیم پیش می‌آید با شکل تحلیل کسب و کار روی داده‌های عظیم هم روبرو می‌شویم، زیرا ابزارهای استاندارد برای جستجو و تحلیل داده‌های عظیم طراحی نشده‌اند. برای رسیدن به تحلیل معنی دار و با ارزش از روی داده‌های عظیم باید بتوانیم پردازش مناسب و قابلیت تحلیل خوب داشته باشیم. بینش قابل استخراج از داده‌های عظیم تمام افراد سازمان را برای تصمیم گیری عمیق‌تر مجهز می‌کند.

دوره کاربردی و آمادگی کلان داده

روند تحلیل اطلاعات در دنیا به سوی استقرار زیر ساخت‌های کلان داده می‌باشد و با توجه به جدید بودن مفهوم و تنوع روش‌ها و مفاهیم مختلف، شرکت مهندسین مشاور نظم آران با بیش از ۱۰ سال سابقه در حوزه انبار داده و هوش کسب و کار، در بیش از ۱۰۰ شرکت، بانک، سازمان، وزارت خانه و موسسه، آمادگی دارد دوره‌ی کاربردی کلان داده را به جهت آشنایی و آمادگی سازمان‌ها و شرکت‌ها برگزار نماید.