Big Data داده های بزرگ

Big Data داده های بزرگ

گروه آموزشی مجموعه تدبیر

خیلی وقت پیش راجع به ویندوز آژور و بکار گیری آن در Big Data نوشتم که همین قضیه علاقه مندان به Big Data را به این سایت میکشاند که تصمیم گرفتم این بار خود Big Data را معرفی کنم. در این مطلب هدف معرفی یکسری واژه است که شما باید بدانید.

شاید در قدیم سروکار با این همه دیتا نداشتیم اما امروزه جریان به این شکل نیست. متاسفانه در ایران مردم همیشه نسبت به تکنلوژی جدید واکنش منفی نشان میدهند، هنگامیکه یک تکنولوژی جدید وارد میشود و کسی علاقه نشان میدهد اطرافیان هستند که میگویند این را میخواهید برای چه کاری. شاید موبایل مثال خوبی در این زمینه باشد. در دنیای امروز سروکله زدن با این همه دیتا بدون این device ها غیر ممکن است در قدیم کسب و کارها این همه مشتری نداشتند و سبک تجارت با دنیای امروز فرق میکرد. هم اکنون در داده ها ما غرق داریم میشیم و این قضیه دیگر تغییر نمیکند بلکه باید آمادگی مواجه با جریانات سنگین تر هم باشیم. حجم فوق العاده عظیمی از دیتاست های پیچیده را داده های بزرگ یا Big Data میگویند.

a به مجموعه ای از داده ها که سایز و گوناگونی آن ها اغلب مافوق توانایی ابزار بانک های اطلاعاتی در جهت Capture، ذخیره سازی، مدیریت و تحلیل است گفته میشود که به گونه ای گردآوری ، ذخیره و استفاده میشوند که امکان جست جو و تحلیل آن ها با هدف کمک به ما در جهت اخذ تصمیم های تجاری را فراهم میکنند.
اما بزرگ یعنی چقدر بزرگ؟
با در نظر گرفتن جریان دائمی داده ها از یک منبع به منبع دیگر، ما درباره پتابایت ها (۱میلیون گیگابایت یا ۱۰۲۴ ترابایت) یا اگزابایت (۱ میلیون ترابایت یا ۱ میلیارد گیگابایت) اطلاعات حرف میزنیم. البته واژه بزرگ خودش تعریفی ندارد، زمانی که صحبت از بزرگ میشود در یک سازمان باید قابلیت های سازمان و سایز خود آن سازمان هم در نظر رفته شود وگرنه میتوانیم صحبت از مقیاس های بزرگتری همچون brontobytes که معادل ۱ و به دنبال ۲۷ صفر است هم صحبت کنیم.

Analytics
این واژه را شاید از google analytics برای شما آشنا باشد و در معنای لغت یعنی تجزیه و تحلیل. وقتی صحبت از Analytics میشود منظور معمولا سمت آمارها و الگوریستم های نرم افزار یا سخت افزار محوری است که برای بیرون کشیدن معنا از داده است. یک Analytics Platform نرم افزاری است که ابزار و توان محاسباتی مورد نیاز برای ساخت و انجام پرس و جوهای پیچیده تحلیلی را فراهم کند. چیزی که باعث معنا بخشیدن به داده ها میشود کشف الگوها است و analytics مجموعه ای از ابزارها استفاده شده برای کشف و ارتباط با آن الگوها به عنوان روشی برای توضیح و تشریح یا حتی پیش بینی کارآی تجاری است.

HANA

hana یک پلتفرم کامپیوتری نرم افزاری / سخت افزاری از sap است. hana که برای مبادله های حجیم و تحلیل های زمان واقعی طراحی شده است قادر است جست جوهای سریع و تحلیل ها را انجام دهد که بخشی از این قابلیت به واسطه این است که قسمت اعظم قدر آن در حافظه باقی میماند.
sap میگوید hana میتواند به شتاب بخشیدن به تحلیل ها، روال های تجاری، محافظت از پردازش داده ها و قابلیت های پیش بینی کننده کمک کند.

حال که صحبت از sap شد بگذارید معرفی کنم:

SAP یک شرکت آلمانی است که دومین شرکت بزرگ نرم افزاری در دنیا پس از مایکروسافت به شمار می رود.

شرکت SAP در سال ۱۹۷۲ در شهر واینهایم در آلمان تأسیس شد و بعدها مقر اصلی آن به والدورف در نزدیکی فرانکفورت منتقل شد. مؤسسان این شرکت پنج جوان بودند که در شرکت IBM با هم آشنا شده بودند. آنها برای اولین بار نرم افزاری برای امور حسابداری و محاسبه ی دستمزد اختراع کردند که اطلاعات را مستقیماً از کاربر دریافت می کرد و آن را از طریق صفحه ی نمایش به کاربر ارائه می کرد. آنها سیستم خود را Realtime می دانستند و به همین دلیل هم تا قبل از سال ۲۰۰۰، یک حرف R به عنوان پیشوند برای نام محصولات خود انتخاب می کردند (مانندSAP R/3 که مشتریان زیادی در سراسر جهان داشته است). مزیت بزرگ سیستم SAP این بود که همه ی وظایف سازمان (از ورود سفارش تا برنامه ریزی مواد و تولید و صدور صورتحساب) را در خود جمع می کرد و بنابراین تنها یک نرم افزار برای مدیریت اطلاعات کافی بود. استفاده از یک بانک اطلاعاتی واحد باعث صرفه جویی زمانی در ثبت و نگهداری اطلاعات می شد. تا ابتدای دهه ی نود، SAP تنها بر روی سخت افزارهای IBM و برخی مدل های زیمنس قابل نصب بود، اما بعد از آن با معرفی R/3 که نیازهای سخت افزاری بالاتری داشت، شرکت SAP به کامپیوترهای یونیکس روی آورد که باعث رشد سریع SAP و فراگیر شدن آن در جهان شد.

امروزه ۵۳۵۰۰ نفر در سراسر جهان مستقیماً برای شرکت SAP کار می کنند. این شرکت در سال ۲۰۱۰ با درآمد ۱۲٫۵ میلیارد یورو، در ردیف چهارمین شرکت تولیدکننده ی نرم افزار در دنیا قرار گرفت. این درآمد از محل فروش نرم افزار (۳۱ درصد)، پشتیبانی (۴۰ درصد)، مشاوره (۲۲ درصد)، آموزش (۴ درصد) و غیره (۳ درصد) تشکیل شده است. SAP حدود ۱۰۰ هزار مشتری در ۱۲۰ کشور دارد و به طور تخمینی ۱۲ میلیون نفر در این کشورها در محل کار خود از محصولات SAP استفاده می کنند. بر اساس اطلاعات شرکت تحقیقات بازار گارتنر، SAP بیش از ۲۸ درصد از بازار نرم افزارهای ERP را در جهان در اختیار دارد. از مهمترین رقبای SAP می توان از مایکروسافت و اوراکل نام برد.ERP  (Enterprise Resource Planning) سیستم جامعی است که سعی در یکپارچه سازی همه وظایف و بخشهای موجود دریک سازمان با استفاده ازیک سیستم کامپیوتری واحد دارد که بتواند نیازهای خاص و ویژه این بخشها را برآورده سازد. این نرم افزار بوسیله یک بانک اطلاعاتی واحد، امکان به اشتراک گذاری اطلاعات و ارتباط بخشهای مختلف را با یکدیگر برقرار میسازد. این نرم افزار از تعدادی ماژول نرم افزاری تشکیل شده است که هر یک بخشی از وظایف موجود در شرکت را بر عهده دارند. اغلب نرم افزارهای ERP آنقدر منعطف هستند که شرکتهای خریدار قادرند تعدادی از ماژولهای مورد نیاز و یا همه آنها را نصب و بکارگیرند. اصلی ترین محصول SAP نیز از این ماژول ها تشکیل شده است.