البيانات الكبيرة تعني مجموعاتٍ كبيرةً من البيانات المتنوعة، المهيكلة وغير المهيكلة وشبه المهيكلة، التي يتم إنشاؤها باستمرار بسرعة عالية وبأحجام كبيرة. تُقاس البيانات الكبيرة عادةً بوحدات تيرابايت أو بيتابايت. واحد بيتابايت يساوي 1000000 جيجابايت. ولتبسيط الأمر، إذا كان فيلم واحد عالي الدقة يحتوي على حوالي 4 جيجابايت من البيانات. فإن واحد بيتابايت يساوي 250000 فيلم. تُحسب مجموعات البيانات الكبيرة في أي مكان بدايةً من المئات وحتى آلاف وملايين البيتابايت.
تحليلات البيانات الكبيرة هي عملية البحث في مجموعات بيانات ضخمة عن الأنماط والاتجاهات والعلاقات. تتطلب هذه التحليلات المعقدة أدواتٍوتقنياتٍ معينة، وقوةً حوسبيةً، وتخزين بيانات يدعم التوسع.
ما كيفية عمل تحليلات البيانات الكبيرة؟
تشتمل تحليلات البيانات الكبيرة على خمس خطوات لتحليل أي من مجموعات البيانات الكبيرة:
- جمع البيانات
- تخزين البيانات
- معالجة البيانات
- تنظيف البيانات
- تحليل البيانات