تحليل البيانات

Apache Spark – مقدمة

تستخدم الصناعات Hadoop على نطاق واسع لتحليل مجموعات البيانات الخاصة بها. والسبب هو أن إطار عمل Hadoop يعتمد على نموذج برمجة بسيط (MapReduce) ويتيح حلاً حاسوبيًا قابلاً للتطوير ومرنًا ومتسامحًا…

Read more

Apache Solr على Hadoop

يمكن استخدام Solr مع Hadoop. نظرًا لأن Hadoop يتعامل مع كمية كبيرة من البيانات، فإن Solr يساعدنا في العثور على المعلومات المطلوبة من مثل هذا المصدر الكبير. في هذا القسم،…

Read more

Apache Solr – أساسيات محرك البحث

يشير محرك البحث إلى قاعدة بيانات ضخمة لموارد الإنترنت مثل صفحات الويب ومجموعات الأخبار والبرامج والصور وما إلى ذلك. ويساعد في تحديد موقع المعلومات على شبكة الويب العالمية. يمكن للمستخدمين…

Read more

Apache Solr – نظرة عامة

Solr عبارة عن منصة بحث مفتوحة المصدر تُستخدم لإنشاء تطبيقات البحث. تم بناؤه على رأس لوسين (محرك بحث النص الكامل). Solr جاهز للمؤسسات وسريع وقابل للتطوير بشكل كبير. التطبيقات المبنية…

Read more

لغة R – المتغيرات

يزودنا المتغير بتخزين مسمى يمكن لبرامجنا التعامل معه. يمكن للمتغير في R تخزين atomic vector أو مجموعة من الـ atomic vectors أو مجموعة من العديد من Robjects. يتكون اسم المتغير…

Read more

لغة R – أنواع البيانات

بشكل عام، أثناء القيام بالبرمجة بأي لغة برمجة، تحتاج إلى استخدام متغيرات مختلفة لتخزين معلومات متنوعة. المتغيرات ليست سوى مواقع ذاكرة محجوزة لتخزين القيم. هذا يعني أنه عند إنشاء متغير…

Read more

ما هو Weka ؟

WEKA – برنامج مفتوح المصدر يوفر أدوات للمعالجة المسبقة للبيانات وتنفيذ العديد من خوارزميات التعلم الآلي وأدوات التصور حتى تتمكن من تطوير تقنيات التعلم الآلي وتطبيقها على مشاكل استخراج البيانات…

Read more

Hadoop – حلول البيانات الضخمة

النهج تقليدي Traditional Approach في هذا النهج، سيكون لدى المؤسسة جهاز كمبيوتر لتخزين ومعالجة البيانات الضخمة. لغرض التخزين، سوف يستفيد المبرمجون من اختيارهم لموردي قواعد البيانات مثل Oracle وIBM وما…

Read more