دورة Apache Spark

عن الدرس

Spark Core هو أساس المشروع بأكمله. فهو يوفر توزيع المهام والجدولة ووظائف الإدخال/الإخراج الأساسية. تستخدم Spark بنية بيانات أساسية متخصصة تُعرف باسم RDD (مجموعات البيانات الموزعة المرنة) وهي عبارة عن مجموعة منطقية من البيانات المقسمة عبر الأجهزة. يمكن إنشاء RDDs بطريقتين؛ الأول هو من خلال الرجوع إلى مجموعات البيانات في أنظمة التخزين الخارجية والثاني هو من خلال تطبيق التحويلات (مثل الخريطة، المرشح، المخفض، الانضمام) على RDDs الموجودة.


المرفقات