تحليل البيانات

Apache Kafka – سير العمل

كافكا هي ببساطة مجموعة من المواضيع مقسمة إلى قسم واحد أو أكثر. قسم كافكا هو تسلسل مرتب خطيًا من الرسائل، حيث يتم تعريف كل رسالة بواسطة فهرسها (يُسمى بالإزاحة). جميع…

Read more

Hadoop – تثبيت بيئة العمل

Hadoop مدعوم من قبل منصة GNU/Linux ونكهاتها. لذلك، يتعين علينا تثبيت نظام تشغيل Linux لإعداد بيئة Hadoop. في حال كان لديك نظام تشغيل آخر غير Linux، يمكنك تثبيت برنامج Virtualbox…

Read more

Apache Kafka – الهيكل الإنشائي

ألق نظرة على الرسم التوضيحي التالي. يُظهر المخطط العنقودي لكافكا. نصف فيمايلي كل مكون من المكونات الموضحة في الرسم البياني أعلاه. الوسيط Broker تتكون مجموعة كافكا عادةً من وسطاء متعددين…

Read more

Hadoop File System – نظرة عامة

تم تطوير نظام ملفات Hadoop باستخدام تصميم نظام الملفات الموزع. يتم تشغيله على الأجهزة السلعية. على عكس الأنظمة الموزعة الأخرى، يتميز نظام HDFS بقدرته العالية على تحمل الأخطاء ومصمم باستخدام…

Read more

Hadoop – عمليات HDFS

بدء تشغيل HDFS في البداية، يتعين عليك تهيئة نظام ملفات HDFS الذي تم تكوينه، وفتح رمز الاسم (خادم HDFS)، وتنفيذ الأمر التالي. بعد تهيئة HDFS، قم بتشغيل نظام الملفات الموزعة.…

Read more

Weka – مقدمة

أساس أي تطبيق للتعلم الآلي هو البيانات – ليست مجرد بيانات صغيرة ولكن بيانات ضخمة تسمى البيانات الضخمة بالمصطلحات الحالية. لتدريب الآلة على تحليل البيانات الضخمة، يجب أن يكون لديك…

Read more

ما هو Weka ؟

WEKA – برنامج مفتوح المصدر يوفر أدوات للمعالجة المسبقة للبيانات وتنفيذ العديد من خوارزميات التعلم الآلي وأدوات التصور حتى تتمكن من تطوير تقنيات التعلم الآلي وتطبيقها على مشاكل استخراج البيانات…

Read more

Hadoop – حلول البيانات الضخمة

النهج تقليدي Traditional Approach في هذا النهج، سيكون لدى المؤسسة جهاز كمبيوتر لتخزين ومعالجة البيانات الضخمة. لغرض التخزين، سوف يستفيد المبرمجون من اختيارهم لموردي قواعد البيانات مثل Oracle وIBM وما…

Read more