تعلم الآلة (ML) هو فرع من فروع الذكاء الاصطناعي (AI). وهو مجال بحثي يُمكّن أجهزة الكمبيوتر من تحسين أدائها ذاتيًا بناءً على بيانات التدريب أو الخبرة (ما تم تعلمه). يمكن لتعلم الآلة التنبؤ تلقائيًا أو اتخاذ القرارات دون الحاجة إلى برمجة محددة.
تنقسم مشاكل تعلم الآلة عادةً إلى نوعين: التنبؤ والتصنيف. من أمثلة مشاكل التنبؤ: توقع أسعار المنازل والسيارات… ومن أمثلة مشاكل التصنيف: التعرف على الكتابة اليدوية والتعرف على الأشياء…
مثال على عملية تعلم الآلة
عملية عمل تعلم الآلة
تتضمن عملية عمل تعلم الآلة الخطوات التالية:
- جمع البيانات: لكي يتمكن الكمبيوتر من التعلم، يجب توفر مجموعة بيانات. يمكنك جمع البيانات بنفسك أو استخدام مجموعات البيانات المنشورة. يجب أن تكون البيانات دقيقة ومن مصادر موثوقة لضمان فعالية تعلم الآلة.
- معالجة البيانات: تتضمن هذه الخطوة تنظيف البيانات، وإزالة السمات غير الضرورية، وتسمية البيانات، وترميز بعض الميزات، واستخراج الميزات، وتقليل حجم البيانات مع الحفاظ على النتائج. غالبًا ما تستغرق هذه الخطوة وقتًا طويلاً، يتناسب طرديًا مع كمية البيانات.
- تدريب النموذج: هذه هي خطوة تدريب النموذج، حيث يتم تعليمه على البيانات التي تم جمعها ومعالجتها في الخطوتين السابقتين.
- تقييم النموذج: بعد التدريب، يجب استخدام مقاييس لتقييم النموذج. يُعتبر النموذج جيدًا إذا حقق دقة تزيد عن 80٪.
- التحسين: إذا لم يحقق النموذج الدقة المطلوبة، فيجب إعادة تدريبه، وتكرار الخطوات من 3 حتى الوصول إلى الدقة المرجوة.
تصنيف تعلم الآلة
عادةً ما يتم تصنيف تعلم الآلة إلى نوعين رئيسيين:
- التعلم المُراقَب: يتعلم الكمبيوتر من بيانات مُعلَّمة (موسومة). لكل مُدخل Xi، يوجد مُخرَج Yi مُقابل.
- التعلم غير المُراقَب: يتعلم الكمبيوتر من بيانات غير مُعلَّمة. ستبحث خوارزميات تعلم الآلة عن ارتباطات البيانات، ونمذجة البيانات، مما يساعد الكمبيوتر على فهم البيانات وتصنيفها إلى مجموعات أو فئات متشابهة أو تقليل أبعاد البيانات.
بعض المفاهيم الأساسية في تعلم الآلة
- مجموعة البيانات: مجموعة البيانات في شكلها الخام قبل المعالجة. تتضمن مجموعة البيانات العديد من نقاط البيانات.
- نقطة البيانات: تُمثل مُشاهدة واحدة. تحتوي كل نقطة بيانات على العديد من الميزات أو السمات، وتنقسم إلى نوعين: البيانات الرقمية والبيانات غير الرقمية (الفئوية).
- بيانات التدريب وبيانات الاختبار: عادةً ما يتم تقسيم مجموعة البيانات إلى هاتين المجموعتين. تُستخدم بيانات التدريب لتدريب النموذج، وتُستخدم بيانات الاختبار للتنبؤ بالنتائج وتقييم النموذج.
- متجه الميزات: يُمثل نقطة بيانات في مجموعة البيانات. يحتوي كل متجه على n بُعد يمثل سمات نقطة البيانات، وكل سمة هي بُعد ويجب أن تكون بيانات رقمية.
- النموذج: يُستخدم النموذج للتدريب على بيانات التدريب وفقًا لخوارزمية ذلك النموذج. بعد ذلك، يمكن للنموذج التنبؤ أو اتخاذ القرارات بناءً على ما تعلمه.
تطبيقات تعلم الآلة
يُستخدم تعلم الآلة على نطاق واسع في العديد من المجالات: المالية والمصرفية، والبيولوجيا، والزراعة، والبحث واستخراج المعلومات، والأتمتة، والروبوتات، والكيمياء، وشبكات الكمبيوتر، وعلوم الفضاء، والإعلان، ومعالجة اللغات الطبيعية، ورؤية الكمبيوتر…
على سبيل المثال، في التنبؤ بالطقس، يُمكّن تطبيق تعلم الآلة الكمبيوتر من تعلم الملاحظات المُسجَّلة في الماضي للتنبؤ بالطقس في المستقبل بدقة أعلى من البشر. تُؤكد فعالية تعلم الآلة أهمية فهمه وتَعلمه في عصر التكنولوجيا 4.0.