بیگ دیتا Big Data یا کلان داده یکی از اصطلاحاتی است که در زمینه فناوری اطلاعات و به خصوص در سال های اخیر بسیار بیشتر آن را شنیده ایم. البته که بیگ دیتا فقط به علوم فناوری اطلاعات محدود نبوده و از آن می توان در بسیاری از زمینه ها از پزشکی و امور اقتصادی گرفته تا حسابداری و امور بانکی بهره برد.
اگر بخواهیم بیگ دیتا را فقط از روی واژه آن تعریف کنیم، احتمالا حدس می زنید که منظور حجم وسیعی از داده هاست. اما این تعریف برای این اصطلاح به ظاهر جدید کفایت نمی کند و نمی تواند منظور واقعی از آن را برساند. در این بخش می خواهیم تعریف دقیق تری از کلان داده داشته و باشیم و با کاربرد آن آشنا شویم. پس همراه ما باشید.
آشنایی با تعریف بیگ دیتا Big Data + مثال
برای این که به تعریف بیگ دیتا برسیم، ابتدا باید دیتا را تعریف کنیم. دیتا که در زبان فارسی معادل «داده» را برای آن تعیین کرده اند به هر مقدار، کاراکتر یا نمادهایی گفته می شود که عملیات آنها توسط رایانه انجام شدنی است. داده ها ممکن است در قالب سیگنال های الکتریکی ذخیره و منتقل شده و در رسانه های ضبط مغناطیسی، نوری یا مکانیکی ثبت شوند.
کلان داده همان طور که از نامش انتظار دارید، مجموعه ای از داده هاست که حجم زیادی دارند. در واقع باید بگوییم که حجم این داده ها با گذشت زمان به طور تصاعدی رشد می کند. اندازه و میزان پیچیدگی این داده ها هم بسیار بیشتر از داده های سنتی است. به طوری که با هیچ یک از ابزارهای مدیریت داده قدیمی نمی توان آنها را ذخیره یا پردازش کرد.
برای این که متوجه حجم کلان داده یا بیگ دیتا شوید یک مثال خوب بورس اوراق بهادار آمریکا است. در این بورس به طور روزانه یک ترابایت داده تجاری جدید تولید می شود.
مثال واضح تر بیگ دیتا Big Data که روزانه با آنها سروکار داریم، رسانه ها و شبکه های اجتماعی هستند. آمارها نشان می دهند که روزانه بیش از 500 ترابایت اطلاعات جدید در پایگاه داده فیسبوک ثبت می شود. این داده ها می تواند پیام متنی، ارسال نظر، فیلم، عکس و موارد دیگری باشد.
و از همه این مثال ها تعجب برانگیزتر، موتور جت است که در هر 30 دقیقه پرواز خود بیش از 10 ترابایت داده تولید می کند. حالا به هزاران پرواز روزانه فکر کنید تا مغزتان دود کند!
اگر نگاهی به این اعداد و ارقام بیندازید متوجه علت نامگذاری کلان داده می شوید. اما بیگ دیتا انواع مختلف و ویژگی های مخصوص به خودش را هم دارد که در ادامه با آنها آشنا می شویم.
انواع کلان داده یا بیگ دیتا کدام است؟!
بیگ دیتا Big Data را می توان به سه دسته کلی تقسیم کرد:
• ساختار یافته یا Structured
• بدون ساختار یا Unstructured
• نیمه ساختار یافته یا Semi-structured
کلان داده ساختار یافته
هرگونه داده ای که بتوان آن را در قالب ثابت ذخیره کرد، در دسترس داشت و پردازش کرد، داده ساختار یافته نامیده می شود. تمام داده هایی که در پایگاه داده یا سیستم های دیتابیس ذخیره می شوند از نوع بیگ دیتا ساختار یافته هستند.
کلان داده بدون ساختار یا خام
هرگونه داده با فرم یا ساختار ناشناخته به عنوان داده های بدون ساختار طبقه بندی می شود. علاوه بر حجم گسترده، داده های بدون ساختار از نظر پردازش برای استخراج ارزش از آن، چالش های متعددی را ایجاد می کنند.
یک مثال ساده از داده های بدون ساختار یک منبع داده ناهمگن است که شامل ترکیبی از فایل های متنی ساده، تصاویر، فیلم ها و غیره است. امروزه سازمان ها اطلاعات زیادی در اختیار دارند، اما متاسفانه نمی دانند چگونه باید از این منابع داده، ارزشی را استخراج کنند. این داده ها به صورت خام یا بدون ساختار هستند.
خروجی گوگل در نتایج جستجو را می توان یک کلان داده بدون ساختار دانست.
بیگ دیتا نیمه ساختار یافته
کلان داده نیمه ساختار یافته هر دو نوع داده ساختار یافته و بدون ساختار را شامل می شود.
به عنوان مثال اطلاعات شخصی ذخیره شده در یک فایل XML می تواند کلان داده نیمه ساختار یافته باشد.
ویژگی های بیگ دیتا یا Big Data 3V Model
زمانی که بیگ دیتا Big Data را تعریف می کنیم معمولا 3 ویژگی برای آن در نظر می گیریم:
• حجم (Volume)
• سرعت (Velocity)
• تنوع (Variety)
البته در مدل های جدیدتر یک ویژگی دیگر هم به این 3 مورد اضافه شده که تغییر پذیری (Variability) است. در زیر با آنها بیشتر آشنا می شویم.
حجم (Volume)
نام بیگ دیتا یا کلان داده خودش به حجم بالای داده ها اشاره دارد. بنابراین حجم داده ها یکی از مهم ترین ویژگی های بیگ دیتا محسوب می شود و نقش پر رنگی در تعیین ارزش داده ها دارد.
اینکه آیا می توان یک داده خاص را به عنوان یک کلان داده در نظر گرفت یا نه، بستگی به حجم آن داده دارد. به همین خاطر حجم یکی از ویژگی هایی است که باید در هنگام برخورد با راه حل های کلان داده مورد توجه قرار داد.
تنوع (Variety)
تنوع ویژگی دیگر بیگ دیتا است که به منابع ناهمگن و ماهیت داده های ساختار یافته و بدون ساختار اشاره دارد.
در گذشته صفحات شیت و دیتابیس ها تنها منابع داده ای بودند که در نظر گرفته می شد. اما در حال حاضر داده ها به شکل ایمیل، عکس، فیلم، دستگاه های نظارتی، PDF، صوت و غیره نیز در برنامه های تجزیه و تحلیل مورد توجه قرار می گیرند.
سرعت (Velocity)
اصطلاح سرعت در بیگ دیتا Big Data به سرعت تولید داده ها اشاره می کند. سرعت تولید و پردازش داده ها برای برآوردن خواسته ها، پتانسیل واقعی را داده های کلان را تعیین می کند.
تغییر پذیری (Variability)
این ویژگی هم به ناسازگاری داده اشاره می کند که در مواقعی در داده ها دیده می شود. بنابراین به نوعی می تواند روند مدیریت و مدیریت موثر داده ها را مختل کند.
کاربرد و مزایای پردازش کلان داده یا بیگ دیتا
• مشاغل مختلف می توانند برای تصمیم گیری از آنالیز داده ها و هوش بیرونی استفاده کنند. دسترسی به داده های شبکه های اجتماعی می تواند استراتژی های تجاری قدرتمندتری را ایجاد کند.
• سیستم های بارخورد مشتری کنار رفته و سیستم های جدیدی که با بیگ دیتا طراحی شده اند می آیند که از فناوری پردازش زبان طبیعی (NLP) بهره برده و باعث بهبود خدمات مشتریان می شوند.
• ریسک های تولیدی سریع تر شناخته شده و بهره وری عملیاتی بیشتر می شود.
• بیگ دیتا Big Data سیستم هایی مسیریابی را با پردازش لحظه ای داده ها، بهبود می دهد.
• امکان شخصی سازی در صنایع مختلف فراهم می شود.
منبع:
https://www.guru99.com
دیدگاه خود را بنویسید