تحليل البيانات - مجلة lbi-egypt

Apache Kafka – سير العمل

محمد أحمد12 أبريل، 202201 مشاهدات

كافكا هي ببساطة مجموعة من المواضيع مقسمة إلى قسم واحد أو أكثر. قسم كافكا هو تسلسل مرتب خطيًا من الرسائل، حيث يتم تعريف كل رسالة بواسطة فهرسها (يُسمى بالإزاحة). جميع…

Hadoop – تثبيت بيئة العمل

محمد أحمد12 أبريل، 202201 مشاهدات

Hadoop مدعوم من قبل منصة GNU/Linux ونكهاتها. لذلك، يتعين علينا تثبيت نظام تشغيل Linux لإعداد بيئة Hadoop. في حال كان لديك نظام تشغيل آخر غير Linux، يمكنك تثبيت برنامج Virtualbox…

Apache Kafka – الهيكل الإنشائي

محمد أحمد12 أبريل، 202201 مشاهدات

ألق نظرة على الرسم التوضيحي التالي. يُظهر المخطط العنقودي لكافكا. نصف فيمايلي كل مكون من المكونات الموضحة في الرسم البياني أعلاه. الوسيط Broker تتكون مجموعة كافكا عادةً من وسطاء متعددين…

Hadoop File System – نظرة عامة

محمد أحمد12 أبريل، 202201 مشاهدات

تم تطوير نظام ملفات Hadoop باستخدام تصميم نظام الملفات الموزع. يتم تشغيله على الأجهزة السلعية. على عكس الأنظمة الموزعة الأخرى، يتميز نظام HDFS بقدرته العالية على تحمل الأخطاء ومصمم باستخدام…

تحليل البيانات الضخمة – مقدمة

محمد أحمد12 أبريل، 202201 مشاهدات

لقد تضخم حجم البيانات التي يتعين على المرء التعامل معها إلى مستويات لا يمكن تصورها في العقد الماضي، وفي الوقت نفسه، انخفض سعر تخزين البيانات بشكل منهجي. تقوم الشركات الخاصة…

Hadoop – عمليات HDFS

محمد أحمد12 أبريل، 202201 مشاهدات

بدء تشغيل HDFS في البداية، يتعين عليك تهيئة نظام ملفات HDFS الذي تم تكوينه، وفتح رمز الاسم (خادم HDFS)، وتنفيذ الأمر التالي. بعد تهيئة HDFS، قم بتشغيل نظام الملفات الموزعة.…

تحليل البيانات الضخمة – المستفيدين

محمد أحمد12 أبريل، 202201 مشاهدات

في المؤسسات الكبيرة، من أجل تطوير مشروع بيانات ضخمة بنجاح، من الضروري أن تدعم الإدارة المشروع. يتضمن هذا عادةً إيجاد طريقة لإظهار المزايا التجارية للمشروع. ليس لدينا حل فريد لمشكلة…

Weka – مقدمة

محمد أحمد12 أبريل، 202201 مشاهدات

أساس أي تطبيق للتعلم الآلي هو البيانات – ليست مجرد بيانات صغيرة ولكن بيانات ضخمة تسمى البيانات الضخمة بالمصطلحات الحالية. لتدريب الآلة على تحليل البيانات الضخمة، يجب أن يكون لديك…

ما هو Weka ؟

محمد أحمد12 أبريل، 202201 مشاهدات

WEKA – برنامج مفتوح المصدر يوفر أدوات للمعالجة المسبقة للبيانات وتنفيذ العديد من خوارزميات التعلم الآلي وأدوات التصور حتى تتمكن من تطوير تقنيات التعلم الآلي وتطبيقها على مشاكل استخراج البيانات…

النهج تقليدي Traditional Approach في هذا النهج، سيكون لدى المؤسسة جهاز كمبيوتر لتخزين ومعالجة البيانات الضخمة. لغرض التخزين، سوف يستفيد المبرمجون من اختيارهم لموردي قواعد البيانات مثل Oracle وIBM وما…