Apache Kafka – سير العمل
كافكا هي ببساطة مجموعة من المواضيع مقسمة إلى قسم واحد أو أكثر. قسم كافكا هو تسلسل مرتب خطيًا من الرسائل، حيث يتم تعريف كل رسالة بواسطة فهرسها (يُسمى بالإزاحة). جميع…
كافكا هي ببساطة مجموعة من المواضيع مقسمة إلى قسم واحد أو أكثر. قسم كافكا هو تسلسل مرتب خطيًا من الرسائل، حيث يتم تعريف كل رسالة بواسطة فهرسها (يُسمى بالإزاحة). جميع…
Hadoop مدعوم من قبل منصة GNU/Linux ونكهاتها. لذلك، يتعين علينا تثبيت نظام تشغيل Linux لإعداد بيئة Hadoop. في حال كان لديك نظام تشغيل آخر غير Linux، يمكنك تثبيت برنامج Virtualbox…
ألق نظرة على الرسم التوضيحي التالي. يُظهر المخطط العنقودي لكافكا. نصف فيمايلي كل مكون من المكونات الموضحة في الرسم البياني أعلاه. الوسيط Broker تتكون مجموعة كافكا عادةً من وسطاء متعددين…
تم تطوير نظام ملفات Hadoop باستخدام تصميم نظام الملفات الموزع. يتم تشغيله على الأجهزة السلعية. على عكس الأنظمة الموزعة الأخرى، يتميز نظام HDFS بقدرته العالية على تحمل الأخطاء ومصمم باستخدام…
لقد تضخم حجم البيانات التي يتعين على المرء التعامل معها إلى مستويات لا يمكن تصورها في العقد الماضي، وفي الوقت نفسه، انخفض سعر تخزين البيانات بشكل منهجي. تقوم الشركات الخاصة…
بدء تشغيل HDFS في البداية، يتعين عليك تهيئة نظام ملفات HDFS الذي تم تكوينه، وفتح رمز الاسم (خادم HDFS)، وتنفيذ الأمر التالي. بعد تهيئة HDFS، قم بتشغيل نظام الملفات الموزعة.…
في المؤسسات الكبيرة، من أجل تطوير مشروع بيانات ضخمة بنجاح، من الضروري أن تدعم الإدارة المشروع. يتضمن هذا عادةً إيجاد طريقة لإظهار المزايا التجارية للمشروع. ليس لدينا حل فريد لمشكلة…
أساس أي تطبيق للتعلم الآلي هو البيانات – ليست مجرد بيانات صغيرة ولكن بيانات ضخمة تسمى البيانات الضخمة بالمصطلحات الحالية. لتدريب الآلة على تحليل البيانات الضخمة، يجب أن يكون لديك…
WEKA – برنامج مفتوح المصدر يوفر أدوات للمعالجة المسبقة للبيانات وتنفيذ العديد من خوارزميات التعلم الآلي وأدوات التصور حتى تتمكن من تطوير تقنيات التعلم الآلي وتطبيقها على مشاكل استخراج البيانات…
النهج تقليدي Traditional Approach في هذا النهج، سيكون لدى المؤسسة جهاز كمبيوتر لتخزين ومعالجة البيانات الضخمة. لغرض التخزين، سوف يستفيد المبرمجون من اختيارهم لموردي قواعد البيانات مثل Oracle وIBM وما…