تحليل البيانات الضخمة

Apache Spark – مقدمة

تستخدم الصناعات Hadoop على نطاق واسع لتحليل مجموعات البيانات الخاصة بها. والسبب هو أن إطار عمل Hadoop يعتمد على نموذج برمجة بسيط (MapReduce) ويتيح حلاً حاسوبيًا قابلاً للتطوير ومرنًا ومتسامحًا…

Read more

Apache Solr على Hadoop

يمكن استخدام Solr مع Hadoop. نظرًا لأن Hadoop يتعامل مع كمية كبيرة من البيانات، فإن Solr يساعدنا في العثور على المعلومات المطلوبة من مثل هذا المصدر الكبير. في هذا القسم،…

Read more

Apache Solr – أساسيات محرك البحث

يشير محرك البحث إلى قاعدة بيانات ضخمة لموارد الإنترنت مثل صفحات الويب ومجموعات الأخبار والبرامج والصور وما إلى ذلك. ويساعد في تحديد موقع المعلومات على شبكة الويب العالمية. يمكن للمستخدمين…

Read more

Apache Solr – نظرة عامة

Solr عبارة عن منصة بحث مفتوحة المصدر تُستخدم لإنشاء تطبيقات البحث. تم بناؤه على رأس لوسين (محرك بحث النص الكامل). Solr جاهز للمؤسسات وسريع وقابل للتطوير بشكل كبير. التطبيقات المبنية…

Read more

لغة R – المتغيرات

يزودنا المتغير بتخزين مسمى يمكن لبرامجنا التعامل معه. يمكن للمتغير في R تخزين atomic vector أو مجموعة من الـ atomic vectors أو مجموعة من العديد من Robjects. يتكون اسم المتغير…

Read more

لغة R – أنواع البيانات

بشكل عام، أثناء القيام بالبرمجة بأي لغة برمجة، تحتاج إلى استخدام متغيرات مختلفة لتخزين معلومات متنوعة. المتغيرات ليست سوى مواقع ذاكرة محجوزة لتخزين القيم. هذا يعني أنه عند إنشاء متغير…

Read more

تحليل البيانات الضخمة – المنهجية

من حيث المنهجية، تختلف تحليلات البيانات الضخمة بشكل كبير عن النهج الإحصائي التقليدي للتصميم التجريبي. التحليلات تبدأ بالبيانات. عادةً ما نقوم بنمذجة البيانات بطريقة تشرح الاستجابة. أهداف هذا النهج هي…

Read more

Hadoop – نظرة عامة

نظرا لظهور التقنيات والأجهزة ووسائل الاتصال الجديدة مثل مواقع الشبكات الاجتماعية، فإن كمية البيانات التي تنتجها البشرية تتزايد بسرعة كل عام. بلغت كمية البيانات التي أنتجها منذ بداية الزمن وحتى…

Read more