دورة Apache Spark

عن الدرس

تعد مجموعات البيانات الموزعة المرنة Resilient Distributed Datasets (RDD) بنية بيانات أساسية لـ Spark. إنها مجموعة موزعة غير قابلة للتغيير من الكائنات. يتم تقسيم كل مجموعة بيانات في RDD إلى أقسام منطقية، والتي يمكن حسابها على عقد مختلفة من المجموعة. يمكن أن تحتوي RDDs على أي نوع من كائنات Python أو Java أو Scala، بما في ذلك الفئات المعرفة من قبل المستخدم.


المرفقات