التعلم الالي

من ويكيبيديا، الموسوعة الحرة
اذهب إلى الملاحة اذهب الى البحث

التعلم الآلي ( ML ) هو دراسة خوارزميات الكمبيوتر التي يمكن أن تتحسن تلقائيًا من خلال التجربة وباستخدام البيانات. [1] يُنظر إليه على أنه جزء من الذكاء الاصطناعي . تبني خوارزميات التعلم الآلي نموذجًا يعتمد على عينات البيانات ، والمعروفة باسم بيانات التدريب ، من أجل عمل تنبؤات أو قرارات دون أن تتم برمجتها بشكل صريح للقيام بذلك. [2] وتستخدم آلة خوارزميات التعلم في طائفة واسعة من التطبيقات، مثل الطب و تصفية البريد الإلكتروني ، التعرف على الكلام ، و رؤية الكمبيوتر، حيث يكون من الصعب أو غير المجدي تطوير خوارزميات تقليدية لأداء المهام المطلوبة. [3]

ترتبط مجموعة فرعية من التعلم الآلي ارتباطًا وثيقًا بالإحصاءات الحسابية ، والتي تركز على إجراء تنبؤات باستخدام أجهزة الكمبيوتر ؛ ولكن ليس كل التعلم الآلي هو تعلم إحصائي. توفر دراسة التحسين الرياضي الأساليب والنظرية ومجالات التطبيق في مجال التعلم الآلي. يعد استخراج البيانات مجالًا ذا صلة بالدراسة ، مع التركيز على تحليل البيانات الاستكشافية من خلال التعلم غير الخاضع للإشراف . [5] [6] تستخدم بعض تطبيقات التعلم الآلي البيانات والشبكات العصبية بطريقة تحاكي عمل الدماغ البيولوجي. [7] [8] يُشار أيضًا إلى التعلم الآلي في تطبيقه عبر مشاكل العمل ، باسم التحليلات التنبؤية .

نظرة عامة

تعمل خوارزميات التعلم على أساس أن الاستراتيجيات والخوارزميات والاستنتاجات التي عملت بشكل جيد في الماضي من المرجح أن تستمر في العمل بشكل جيد في المستقبل. يمكن أن تكون هذه الاستنتاجات واضحة ، مثل "بما أن الشمس تشرق كل صباح خلال آخر 10000 يوم ، فمن المحتمل أن تشرق صباح الغد أيضًا". يمكن أن تكون دقيقة ، مثل "X٪ من العائلات لديها أنواع منفصلة جغرافيًا مع متغيرات لونية ، لذلك هناك فرصة بنسبة Y٪ لوجود البجعات السوداء غير المكتشفة ". [9]

يمكن لبرامج التعلم الآلي أداء المهام دون أن تتم برمجتها بشكل صريح للقيام بذلك. وهي تتضمن تعلم أجهزة الكمبيوتر من البيانات المقدمة حتى تقوم بمهام معينة. بالنسبة للمهام البسيطة المخصصة لأجهزة الكمبيوتر ، من الممكن برمجة خوارزميات تخبر الجهاز بكيفية تنفيذ جميع الخطوات المطلوبة لحل المشكلة المطروحة ؛ من جانب الكمبيوتر ، ليست هناك حاجة للتعلم. بالنسبة للمهام الأكثر تقدمًا ، قد يكون من الصعب على الإنسان إنشاء الخوارزميات المطلوبة يدويًا. في الممارسة العملية ، يمكن أن يكون أكثر فاعلية لمساعدة الآلة على تطوير خوارزمية خاصة بها ، بدلاً من جعل المبرمجين البشريين يحددون كل خطوة مطلوبة. [10]

يستخدم نظام التعلم الآلي مناهج مختلفة لتعليم أجهزة الكمبيوتر لإنجاز المهام التي لا تتوفر فيها خوارزمية مرضية تمامًا. في الحالات التي توجد فيها أعداد هائلة من الإجابات المحتملة ، تتمثل إحدى الطرق في تصنيف بعض الإجابات الصحيحة على أنها صحيحة. يمكن بعد ذلك استخدام ذلك كبيانات تدريب للكمبيوتر لتحسين الخوارزمية (الخوارزميات) التي يستخدمها لتحديد الإجابات الصحيحة. على سبيل المثال ، لتدريب نظام على مهمة التعرف على الأحرف الرقمية ، غالبًا ما يتم استخدام مجموعة بيانات MNIST للأرقام المكتوبة بخط اليد. [10]

التاريخ والعلاقات مع الحقول الأخرى

على المدى تعلم الآلة التي صيغت في عام 1959 من قبل آرثر صموئيل ، وهو أمريكي IBMer والرائدة في مجال ألعاب الكمبيوتر و الذكاء الاصطناعي . [11] [12] كما تم استخدام أجهزة الكمبيوتر ذاتية التعليم المرادف في هذه الفترة الزمنية. [13] [14] كان الكتاب التمثيلي لبحوث التعلم الآلي خلال الستينيات هو كتاب نيلسون عن آلات التعلم ، ويتعامل في الغالب مع التعلم الآلي لتصنيف الأنماط. [15] استمر الاهتمام بالتعرف على الأنماط في السبعينيات ، كما وصفه دودا وهارت في عام 1973. [16]في عام 1981 ، تم تقديم تقرير حول استخدام استراتيجيات التدريس بحيث تتعلم الشبكة العصبية التعرف على 40 حرفًا (26 حرفًا و 10 أرقام و 4 رموز خاصة) من محطة كمبيوتر. [17]

قدم توم إم ميتشل تعريفًا رسميًا مقتبسًا على نطاق واسع للخوارزميات التي تمت دراستها في مجال التعلم الآلي: "يُقال أن برنامج الكمبيوتر يتعلم من التجربة E فيما يتعلق ببعض فئة المهام T وقياس الأداء P إذا كان أداءه في المهام في T ، كما تم قياسه بواسطة P ، يتحسن مع الخبرة E. " [18] يقدم هذا التعريف للمهام التي يتعلق بها التعلم الآلي تعريفًا تشغيليًا أساسيًا بدلاً من تعريف المجال من خلال المصطلحات المعرفية. يأتي هذا بعد اقتراح آلان تورينج في ورقته " الحوسبة الآلية والذكاء"، والتي على السؤال" "يتم استبدال مع السؤال" آلات أن أفكر؟ آلات نستطيع أن نفعل ما (ككيانات التفكير) يمكن أن نفعل؟ ". [19]

يحتوي التعلم الآلي الحديث على هدفين ، أحدهما هو تصنيف البيانات بناءً على النماذج التي تم تطويرها ، والغرض الآخر هو عمل تنبؤات للنتائج المستقبلية بناءً على هذه النماذج. قد تستخدم خوارزمية افتراضية خاصة بتصنيف البيانات رؤية الكمبيوتر للشامات إلى جانب التعلم الخاضع للإشراف من أجل تدريبها على تصنيف الشامات السرطانية. حيث يمكن لخوارزمية التعلم الآلي لتداول الأسهم إعلام المتداول بالتنبؤات المستقبلية المحتملة. [20]

الذكاء الاصطناعي

التعلم الآلي كحقل فرعي من الذكاء الاصطناعي [21]
جزء من التعلم الآلي كحقل فرعي من الذكاء الاصطناعي أو جزء من الذكاء الاصطناعي كحقل فرعي للتعلم الآلي [22]

كمحاولة علمية ، نشأ التعلم الآلي من السعي وراء الذكاء الاصطناعي. في الأيام الأولى للذكاء الاصطناعي كنظام أكاديمي ، كان بعض الباحثين مهتمين بتعلم الآلات من البيانات. لقد حاولوا التعامل مع المشكلة بأساليب رمزية مختلفة ، بالإضافة إلى ما كان يسمى حينها " الشبكات العصبية ". كانت هذه في الغالب بيرسيبترون و نماذج أخرى التي تم العثور عليها لاحقا reinventions من النماذج الخطية المعممة من الإحصاءات. [23] كما تم استخدام الاستدلال الاحتمالي ، خاصة في التشخيص الطبي الآلي . [24] : 488 

ومع ذلك ، تسبب التركيز المتزايد على النهج المنطقي القائم على المعرفة في حدوث شقاق بين الذكاء الاصطناعي والتعلم الآلي. ابتليت الأنظمة الاحتمالية بالمشكلات النظرية والعملية المتعلقة بالحصول على البيانات وتمثيلها. [24] : 488  بحلول عام 1980 ، أصبحت الأنظمة الخبيرة تهيمن على الذكاء الاصطناعي ، وكانت الإحصائيات غير مفضلة. [25] العمل على التعلم الرمزي القائم على المعرفة / لم تستمر في منظمة العفو الدولية، مما يؤدي إلى برمجة المنطق الاستقرائي ، ولكن الخط كان أكثر الإحصائي للبحوث الآن خارج مجال AI السليم، في التعرف على الأنماط و استرجاع المعلومات . [24] : 708-710 ، 755 تم التخلي عن أبحاث الشبكات العصبية من قبل الذكاء الاصطناعي وعلوم الكمبيوتر في نفس الوقت تقريبًا. هذا الخط أيضا، واستمر خارج مجال AI / CS، إذ أن " الصلة connectionism " التي أجراها باحثون من التخصصات الأخرى بما في ذلك Hopfield ، Rumelhart و هينتون . جاء نجاحهم الرئيسي في منتصف الثمانينيات مع إعادة اختراع التكاثر العكسي . [24] : 25 

بدأ التعلم الآلي (ML) ، الذي أعيد تنظيمه كحقل منفصل ، في الازدهار في التسعينيات. غير المجال هدفه من تحقيق الذكاء الاصطناعي إلى معالجة المشكلات ذات الطبيعة العملية القابلة للحل. لقد حولت التركيز بعيدًا عن الأساليب الرمزية التي ورثتها من الذكاء الاصطناعي ، ونحو الأساليب والنماذج المستعارة من الإحصاءات ونظرية الاحتمالات . [25]

كثيرًا ما يُساء فهم الفرق بين تعلم الآلة والذكاء الاصطناعي. يتعلم التعلم الآلي ويتنبأ بناءً على الملاحظات السلبية ، في حين أن الذكاء الاصطناعي يعني ضمناً وجود وكيل يتفاعل مع البيئة للتعلم واتخاذ الإجراءات التي تزيد من فرصته في تحقيق أهدافه بنجاح. [26]

اعتبارًا من عام 2020 ، استمرت العديد من المصادر في التأكيد على أن ML لا يزال مجالًا فرعيًا للذكاء الاصطناعي. [27] [28] [25] يرى آخرون أن تعلم الآلة ليس كل جزء من الذكاء الاصطناعي ، ولكن فقط "مجموعة فرعية ذكية" من تعلم الآلة يجب اعتبارها ذكاءً. [4] [29] [30]

التنقيب في البيانات

غالبًا ما يستخدم التعلم الآلي واستخراج البيانات نفس الأساليب ويتداخلان بشكل كبير ، ولكن بينما يركز التعلم الآلي على التنبؤ ، بناءً على الخصائص المعروفة المكتسبة من بيانات التدريب ، يركز التنقيب في البيانات على اكتشاف خصائص غير معروفة (سابقًا) في البيانات (هذا هو خطوة التحليل لاكتشاف المعرفةفي قواعد البيانات). يستخدم التنقيب عن البيانات العديد من أساليب التعلم الآلي ، ولكن بأهداف مختلفة ؛ من ناحية أخرى ، يستخدم التعلم الآلي أيضًا أساليب التنقيب عن البيانات مثل "التعلم غير الخاضع للإشراف" أو كخطوة معالجة مسبقة لتحسين دقة المتعلم. يأتي الكثير من الالتباس بين هذين المجتمعين البحثيين (اللذان غالبًا ما يكون لهما مؤتمرات منفصلة ومجلات منفصلة ، ويعد ECML PKDD استثناءً رئيسيًا) من الافتراضات الأساسية التي يعملان معها: في التعلم الآلي ، يتم عادةً تقييم الأداء فيما يتعلق بالقدرة على إعادة إنتاج المعرفة المعروفة ، بينما في اكتشاف المعرفة واستخراج البيانات (KDD) تكون المهمة الرئيسية هي اكتشاف ما لم يكن معروفًا من قبلالمعرفه. نظرًا للتقييم فيما يتعلق بالمعرفة المعروفة ، فإن الطريقة غير الخاضعة للإشراف (غير الخاضعة للإشراف) سوف تتفوق عليها بسهولة من خلال طرق أخرى خاضعة للإشراف ، بينما في مهمة KDD النموذجية ، لا يمكن استخدام الأساليب الخاضعة للإشراف بسبب عدم توفر بيانات التدريب.

التحسين

يرتبط التعلم الآلي أيضًا بعلاقات وثيقة مع التحسين : تتم صياغة العديد من مشكلات التعلم كتقليل بعض وظائف الخسارة في مجموعة من الأمثلة التدريبية. تعبر وظائف الخسارة عن التناقض بين تنبؤات النموذج الذي يتم تدريبه وحالات المشكلة الفعلية (على سبيل المثال ، في التصنيف ، يريد المرء تعيين تسمية للحالات ، ويتم تدريب النماذج على التنبؤ بشكل صحيح بالتسميات المحددة مسبقًا لمجموعة من أمثلة). [31]

التعميم

ينشأ الاختلاف بين التحسين والتعلم الآلي من هدف التعميم: في حين أن خوارزميات التحسين يمكن أن تقلل من الخسارة في مجموعة التدريب ، فإن التعلم الآلي يهتم بتقليل الخسارة في العينات غير المرئية. يعد توصيف تعميم خوارزميات التعلم المختلفة موضوعًا نشطًا للبحث الحالي ، خاصةً بالنسبة لخوارزميات التعلم العميق .

إحصائيات

يعد التعلم الآلي والإحصاء مجالين وثيقين الصلة من حيث الأساليب ، ولكنهما متميزان في هدفهما الرئيسي: تستخلص الإحصائيات الاستدلالات السكانية من عينة ، بينما يجد التعلم الآلي أنماطًا تنبؤية قابلة للتعميم. [32] وفقًا لمايكل جوردان ، فإن أفكار التعلم الآلي ، من المبادئ المنهجية إلى الأدوات النظرية ، لها تاريخ سابق طويل في الإحصاء. [33] كما اقترح مصطلح علم البيانات كعنصر نائب لاستدعاء المجال العام. [33]

ميز ليو بريمان نموذجين للنمذجة الإحصائية: نموذج البيانات ونموذج الخوارزمية ، [27] حيث يعني "النموذج الحسابي" أكثر أو أقل خوارزميات التعلم الآلي مثل Random Forest .

اعتمد بعض الإحصائيين طرقًا من التعلم الآلي ، مما أدى إلى مجال مشترك يسمونه التعلم الإحصائي . [28]

نظرية

الهدف الأساسي للمتعلم هو التعميم من تجربته. [4] [29] التعميم في هذا السياق هو قدرة آلة التعلم على الأداء بدقة على الأمثلة / المهام الجديدة غير المرئية بعد تجربة مجموعة بيانات التعلم. تأتي الأمثلة التدريبية من بعض توزيعات الاحتمالات غير المعروفة عمومًا (تعتبر ممثلة لمساحة الأحداث) ويتعين على المتعلم بناء نموذج عام حول هذا الفضاء يمكنه من إنتاج تنبؤات دقيقة بما فيه الكفاية في الحالات الجديدة.

يعد التحليل الحسابي لخوارزميات التعلم الآلي وأدائها فرعًا من فروع علوم الكمبيوتر النظرية المعروفة باسم نظرية التعلم الحسابي . نظرًا لأن مجموعات التدريب محدودة والمستقبل غير مؤكد ، فإن نظرية التعلم عادة لا تعطي ضمانات لأداء الخوارزميات. بدلاً من ذلك ، الحدود الاحتمالية على الأداء شائعة جدًا. يعتبر تحلل التحيز والتباين أحد الطرق لتقدير خطأ التعميم .

للحصول على أفضل أداء في سياق التعميم ، يجب أن يتطابق تعقيد الفرضية مع تعقيد الوظيفة التي تقوم عليها البيانات. إذا كانت الفرضية أقل تعقيدًا من الوظيفة ، فحينئذٍ يكون النموذج قد احتوى على البيانات. إذا زاد تعقيد النموذج استجابةً لذلك ، ينخفض ​​خطأ التدريب. ولكن إذا كانت الفرضية معقدة للغاية ، فسيكون النموذج عرضة للإفراط في التجهيز وسيكون التعميم أكثر فقراً. [30]

بالإضافة إلى حدود الأداء ، يدرس منظرو التعلم التعقيد الزمني وجدوى التعلم. في نظرية التعلم الحسابي ، تعتبر العملية الحسابية ممكنة إذا كان من الممكن إجراؤها في زمن كثير الحدود . هناك نوعان من نتائج تعقيد الوقت . تظهر النتائج الإيجابية أنه يمكن تعلم فئة معينة من الوظائف في وقت كثير الحدود. تظهر النتائج السلبية أنه لا يمكن تعلم فئات معينة في وقت كثير الحدود.

المناهج

تنقسم مناهج التعلم الآلي تقليديًا إلى ثلاث فئات عريضة ، اعتمادًا على طبيعة "الإشارة" أو "التعليقات" المتاحة لنظام التعلم:

  • التعلم تحت الإشراف : يتم تقديم الكمبيوتر مع أمثلة على المدخلات والمخرجات المرغوبة ، والتي يقدمها "المعلم" ، والهدف هو تعلم قاعدة عامة تحدد المدخلات إلى المخرجات.
  • التعلم غير الخاضع للإشراف : لا يتم إعطاء تسميات لخوارزمية التعلم ، مما يتركها بمفردها لإيجاد بنية في مدخلاتها. يمكن أن يكون التعلم غير الخاضع للإشراف هدفًا في حد ذاته (اكتشاف الأنماط المخفية في البيانات) أو وسيلة لتحقيق غاية ( التعلم المميز ).
  • التعلم المعزز : يتفاعل برنامج الكمبيوتر مع بيئة ديناميكية يجب أن يؤدي فيها هدفًا معينًا (مثل قيادة مركبة أو لعب لعبة ضد خصم). أثناء التنقل في مساحة المشكلة ، يتم تزويد البرنامج بتعليقات مماثلة للمكافآت ، والتي يحاول تعظيمها. [4]

التعلم الخاضع للإشراف

A آلة الدعم الموجه هو نموذج التعلم بإشراف أن الانقسامات البيانات في المناطق مفصولة على الحدود الخطي . هنا ، تقسم الحدود الخطية الدوائر السوداء من البيضاء.

تبني خوارزميات التعلم الخاضعة للإشراف نموذجًا رياضيًا لمجموعة البيانات التي تحتوي على المدخلات والمخرجات المرغوبة. [34] تُعرف البيانات باسم بيانات التدريب ، وتتكون من مجموعة من أمثلة التدريب. يحتوي كل مثال تدريبي على واحد أو أكثر من المدخلات والمخرجات المرغوبة ، والمعروفة أيضًا باسم الإشارة الإشرافية. في النموذج الرياضي ، يتم تمثيل كل مثال تدريبي بمصفوفة أو متجه ، يُطلق عليه أحيانًا متجه الميزة ، ويتم تمثيل بيانات التدريب بواسطة مصفوفة . من خلال تحسين تكرارية ل دالة الهدف ، أشرف تعلم الخوارزميات تعلم وظيفة التي يمكن استخدامها للتنبؤ الانتاج المرتبطة مدخلات جديدة. [35]ستسمح الوظيفة المثلى للخوارزمية بتحديد مخرجات المدخلات التي لم تكن جزءًا من بيانات التدريب بشكل صحيح. يقال إن الخوارزمية التي تعمل على تحسين دقة مخرجاتها أو تنبؤاتها بمرور الوقت قد تعلمت أداء هذه المهمة. [18]

وتشمل أنواع من خوارزميات التعلم تحت إشراف التعلم النشط ، تصنيف و الانحدار . [26] تُستخدم خوارزميات التصنيف عندما تقتصر النواتج على مجموعة محدودة من القيم ، وتُستخدم خوارزميات الانحدار عندما يكون للمخرجات أي قيمة عددية ضمن النطاق. على سبيل المثال ، بالنسبة لخوارزمية التصنيف التي تقوم بتصفية رسائل البريد الإلكتروني ، سيكون الإدخال عبارة عن بريد إلكتروني وارد ، وسيكون الناتج هو اسم المجلد الذي سيتم إرسال البريد الإلكتروني فيه.

تعلم التشابه هو مجال من مجالات التعلم الآلي الخاضع للإشراف والذي يرتبط ارتباطًا وثيقًا بالانحدار والتصنيف ، ولكن الهدف هو التعلم من الأمثلة باستخدام وظيفة التشابه التي تقيس مدى تشابه أو ارتباط كائنين. لها تطبيقات في الترتيب ، نظم توصية ، وتتبع الهوية البصرية، والتحقق من وجهه، والتحقق المتحدث.

التعلم غير الخاضع للإشراف

تأخذ خوارزميات التعلم غير الخاضعة للإشراف مجموعة من البيانات التي تحتوي فقط على المدخلات ، وتجد بنية في البيانات ، مثل تجميع أو تجميع نقاط البيانات. لذلك ، تتعلم الخوارزميات من بيانات الاختبار التي لم يتم تصنيفها أو تصنيفها أو تصنيفها. بدلاً من الاستجابة للتعليقات ، تحدد خوارزميات التعلم غير الخاضعة للإشراف القواسم المشتركة في البيانات وتتفاعل بناءً على وجود أو عدم وجود مثل هذه القواسم المشتركة في كل جزء جديد من البيانات. يوجد تطبيق مركزي للتعلم غير الخاضع للإشراف في مجال تقدير الكثافة في الإحصاء ، مثل إيجاد دالة كثافة الاحتمال . [36] على الرغم من أن التعلم غير الخاضع للإشراف يشمل مجالات أخرى تتضمن تلخيص وشرح ميزات البيانات.

تحليل الكتلة هو تعيين مجموعة من الملاحظات في مجموعات فرعية (تسمى المجموعات ) بحيث تكون الملاحظات داخل نفس المجموعة متشابهة وفقًا لمعيار واحد أو أكثر من المعايير المحددة مسبقًا ، في حين تختلف الملاحظات المستمدة من مجموعات مختلفة. تقدم تقنيات التجميع المختلفة افتراضات مختلفة حول بنية البيانات ، غالبًا ما يتم تحديدها بواسطة بعض مقاييس التشابه ويتم تقييمها ، على سبيل المثال ، عن طريق الضغط الداخلي ، أو التشابه بين أعضاء نفس المجموعة ، والفصل ، الفرق بين المجموعات. تستند أساليب أخرى على كثافة يقدر و الاتصال الرسم البياني .

التعلم شبه الخاضع للإشراف

يقع التعلم شبه الخاضع للإشراف بين التعلم غير الخاضع للإشراف (بدون أي بيانات تدريب معنونة) والتعلم الخاضع للإشراف (مع بيانات تدريب مصنفة بالكامل). تفتقد بعض الأمثلة التدريبية إلى تسميات التدريب ، ومع ذلك فقد وجد العديد من الباحثين في مجال التعلم الآلي أن البيانات غير المصنفة ، عند استخدامها بالاقتران مع كمية صغيرة من البيانات المصنفة ، يمكن أن تؤدي إلى تحسن كبير في دقة التعلم.

في التعلم الخاضع للإشراف الضعيف ، تكون ملصقات التدريب صاخبة أو محدودة أو غير دقيقة ؛ ومع ذلك ، غالبًا ما يكون الحصول على هذه الملصقات أرخص ، مما يؤدي إلى مجموعات تدريب فعالة أكبر. [37]

التعلم المعزز

التعلم المعزز هو مجال من مجالات التعلم الآلي يهتم بكيفية قيام وكلاء البرمجيات باتخاذ إجراءات في بيئة ما لتحقيق أقصى قدر من فكرة المكافأة التراكمية. نظرًا لعموميتها ، تتم دراسة المجال في العديد من التخصصات الأخرى ، مثل نظرية اللعبة ، ونظرية التحكم ، وبحوث العمليات ، ونظرية المعلومات ، والتحسين القائم على المحاكاة ، والأنظمة متعددة العوامل ، وذكاء السرب ، والإحصاءات ، والخوارزميات الجينية . في التعلم الآلي ، يتم تمثيل البيئة عادةً على أنها عملية قرار ماركوف(MDP). تستخدم العديد من خوارزميات التعلم المعزز تقنيات البرمجة الديناميكية . [38] لا تفترض خوارزميات التعلم المعزز معرفة النموذج الرياضي الدقيق لـ MDP ، ويتم استخدامها عندما تكون النماذج الدقيقة غير قابلة للتنفيذ. تُستخدم خوارزميات التعلم المعزز في المركبات ذاتية القيادة أو في تعلم لعب لعبة ضد خصم بشري.

تخفيض الأبعاد

تقليل الأبعاد هو عملية تقليل عدد المتغيرات العشوائية قيد الدراسة من خلال الحصول على مجموعة من المتغيرات الرئيسية. [39] بمعنى آخر ، إنها عملية لتقليل أبعاد مجموعة الميزات ، وتسمى أيضًا "عدد الميزات". يمكن اعتبار معظم تقنيات تقليل الأبعاد إما إزالة الميزة أو الاستخراج. يعد تحليل المكون الأساسي (PCA) أحد الأساليب الشائعة لتقليل الأبعاد . يتضمن PCA تغيير البيانات ذات الأبعاد الأعلى (مثل ، 3D) إلى مساحة أصغر (على سبيل المثال ، 2D). ينتج عن هذا بُعد أصغر للبيانات (ثنائي الأبعاد بدلاً من ثلاثي الأبعاد) ، مع الاحتفاظ بجميع المتغيرات الأصلية في النموذج دون تغيير البيانات. [40] و فرضية المتعددةيقترح أن مجموعات البيانات عالية الأبعاد تقع على طول المشعبات منخفضة الأبعاد ، وأن العديد من تقنيات تقليل الأبعاد تجعل هذا الافتراض ، مما يؤدي إلى مجال التعلم المتنوع والتنظيم المتنوع .

أنواع أخرى

تم تطوير مناهج أخرى لا تتناسب تمامًا مع هذا التصنيف ثلاثي الأبعاد ، وفي بعض الأحيان يتم استخدام أكثر من طريقة بواسطة نفس نظام التعلم الآلي. على سبيل المثال نمذجة الموضوع ، التعلم التلوي . [41]

اعتبارًا من عام 2020 ، أصبح التعلم العميق هو النهج السائد لكثير من العمل المستمر في مجال التعلم الآلي. [10]

التعلم الذاتي

تم تقديم التعلم الذاتي كنموذج للتعلم الآلي في عام 1982 جنبًا إلى جنب مع شبكة عصبية قادرة على التعلم الذاتي تسمى الصفيف التكيفي عبر العارضة (CAA). [42] إنه تعلم بدون مكافآت خارجية ولا نصيحة معلم خارجي. تحسب خوارزمية التعلم الذاتي CAA ، بطريقة العارضة ، كل من القرارات المتعلقة بالأفعال والعواطف (المشاعر) حول مواقف العواقب. النظام مدفوع بالتفاعل بين الإدراك والعاطفة. [43] تقوم خوارزمية التعلم الذاتي بتحديث مصفوفة الذاكرة W = || w (a، s) || بحيث يتم تنفيذ روتين التعلم الآلي التالي في كل تكرار:

 في حالة القيام بعمل أ ؛
 تلقي حالة عواقب؛
 حساب المشاعر من كونك في حالة عاقبة (ق) ؛
 تحديث ذاكرة العارضة w '(a، s) = w (a، s) + v (s').

إنه نظام به مدخل واحد ، أو مواقف ، ومخرج واحد فقط ، أو إجراء (أو سلوك) أ. لا يوجد مدخل تعزيز منفصل ولا مدخلات مشورة من البيئة. القيمة backpropagated (التعزيز الثانوي) هي العاطفة تجاه حالة العواقب. يوجد CAA في بيئتين ، أحدهما هو البيئة السلوكية حيث يتصرف ، والآخر هو البيئة الجينية ، حيث يستقبل منها في البداية ومرة ​​واحدة فقط المشاعر الأولية حول المواقف التي يجب مواجهتها في البيئة السلوكية. بعد تلقي ناقل الجينوم (الأنواع) من البيئة الجينية ، تتعلم هيئة الطيران المدني سلوكًا يسعى إلى تحقيق الهدف ، في بيئة تحتوي على مواقف مرغوبة وغير مرغوب فيها. [44]

ميزة التعلم

تهدف العديد من خوارزميات التعلم إلى اكتشاف تمثيلات أفضل للمدخلات المقدمة أثناء التدريب. [45] تشمل الأمثلة الكلاسيكية تحليل المكونات الرئيسية وتحليل الكتلة. غالبًا ما تحاول خوارزميات تعلم الميزات ، والتي تسمى أيضًا خوارزميات التعلم التمثيلية ، الحفاظ على المعلومات في مدخلاتها ولكن أيضًا تحويلها بطريقة تجعلها مفيدة ، غالبًا كخطوة معالجة مسبقة قبل إجراء التصنيف أو التنبؤات. تسمح هذه التقنية بإعادة بناء المدخلات القادمة من التوزيع غير المعروف لتوليد البيانات ، بينما لا تكون بالضرورة وفية للتكوينات التي لا يمكن تصديقها في ظل هذا التوزيع. هذا يحل محل هندسة الميزات اليدوية، ويسمح للآلة بالتعرف على الميزات واستخدامها لأداء مهمة محددة.

يمكن أن يكون تعلم الميزات إما خاضعًا للإشراف أو غير خاضع للإشراف. في التعلم الخاضع للإشراف ، يتم تعلم الميزات باستخدام بيانات الإدخال المصنفة. تشمل الأمثلة الشبكات العصبية الاصطناعية ، والمدركات متعددة الطبقات ، وتعلم القاموس تحت الإشراف . في تعلم الميزات غير الخاضع للإشراف ، يتم التعرف على الميزات ببيانات الإدخال غير المسماة. ومن الأمثلة على ذلك التعلم القاموس، تحليل عنصر مستقل ، autoencoders ، مصفوفة التعميل [46] وأشكال مختلفة من التجميع . [47] [48] [49]

تحاول خوارزميات التعلم المتنوعة القيام بذلك في ظل قيود أن التمثيل الذي تم تعلمه منخفض الأبعاد. تحاول خوارزميات التشفير المتفرقة القيام بذلك في ظل القيد بأن التمثيل الذي تم تعلمه ضئيل ، مما يعني أن النموذج الرياضي يحتوي على العديد من الأصفار. تهدف خوارزميات تعلم الفضاء الجزئي متعدد الخطوط إلى تعلم التمثيلات منخفضة الأبعاد مباشرة من تمثيلات الموتر للبيانات متعددة الأبعاد ، دون إعادة تشكيلها في نواقل ذات أبعاد أعلى. [50] التعلم العميقتكتشف الخوارزميات مستويات متعددة من التمثيل ، أو تسلسل هرمي للميزات ، بمستوى أعلى ، وميزات أكثر تجريدية محددة من حيث (أو إنشاء) ميزات المستوى الأدنى. لقد قيل أن الآلة الذكية هي التي تتعلم التمثيل الذي يفكك تشابك العوامل الأساسية للتباين التي تشرح البيانات المرصودة. [51]

يتم تحفيز تعلم الميزات من خلال حقيقة أن مهام التعلم الآلي مثل التصنيف تتطلب في كثير من الأحيان إدخالاً يكون مناسبًا للعملية من الناحية الحسابية والرياضية. ومع ذلك ، فإن بيانات العالم الحقيقي مثل الصور ومقاطع الفيديو والبيانات الحسية لم تسفر عن محاولات لتعريف خوارزميات معينة لميزات معينة. البديل هو اكتشاف مثل هذه الميزات أو التمثيلات من خلال الفحص ، دون الاعتماد على خوارزميات صريحة.

تعلم القاموس المتفرق

تعلم القاموس المتفرق هو طريقة تعلم ميزة حيث يتم تمثيل مثال التدريب كمجموعة خطية من الوظائف الأساسية ، ويفترض أن يكون مصفوفة متفرقة . هذه الطريقة صعبة للغاية ويصعب حلها تقريبًا. [52] طريقة الكشف عن مجريات الأمور الشائعة لتعلم القواميس المتفرقة هي K-SVDالخوارزمية. تم تطبيق تعلم القاموس المتفرق في سياقات عديدة. في التصنيف ، تكمن المشكلة في تحديد الفئة التي ينتمي إليها مثال تدريب لم يسبق رؤيته. بالنسبة إلى القاموس الذي تم فيه إنشاء كل فصل بالفعل ، يتم ربط مثال تدريب جديد بالفصل الذي يتم تمثيله بشكل متناثر بواسطة القاموس المقابل. كما تم تطبيق تعلم القاموس المتفرق في إزالة الضوضاء من الصورة . الفكرة الأساسية هي أن تصحيح الصورة النظيفة يمكن تمثيله بشكل ضئيل بواسطة قاموس الصور ، لكن لا يمكن للضوضاء. [53]

كشف الشذوذ

في التنقيب عن البيانات ، يعد اكتشاف الشذوذ ، المعروف أيضًا باسم الكشف الخارجي ، هو تحديد العناصر النادرة أو الأحداث أو الملاحظات التي تثير الشكوك من خلال الاختلاف الكبير عن غالبية البيانات. [54] عادةً ما تمثل العناصر الشاذة مشكلة مثل الاحتيال المصرفي أو عيب هيكلي أو مشكلات طبية أو أخطاء في النص. يشار إلى الحالات الشاذة على أنها القيم المتطرفة والمستجدات والضوضاء والانحرافات والاستثناءات. [55]

على وجه الخصوص ، في سياق الكشف عن إساءة الاستخدام والتطفل على الشبكة ، غالبًا ما لا تكون الأشياء المثيرة للاهتمام كائنات نادرة ، ولكنها دفعات غير متوقعة من الخمول. لا يلتزم هذا النمط بالتعريف الإحصائي الشائع للعناصر الخارجية ككائن نادر ، وستفشل العديد من طرق الكشف الخارجية (على وجه الخصوص ، الخوارزميات غير الخاضعة للإشراف) في مثل هذه البيانات ما لم يتم تجميعها بشكل مناسب. بدلاً من ذلك ، قد تكون خوارزمية تحليل الكتلة قادرة على اكتشاف المجموعات الدقيقة التي تشكلها هذه الأنماط. [56]

توجد ثلاث فئات واسعة من تقنيات الكشف عن الشذوذ. [57] تكتشف تقنيات اكتشاف الشذوذ غير الخاضعة للإشراف الحالات الشاذة في مجموعة بيانات الاختبار غير المسماة على افتراض أن غالبية الحالات في مجموعة البيانات طبيعية ، من خلال البحث عن الحالات التي يبدو أنها تتلاءم بشكل أقل مع بقية مجموعة البيانات. تتطلب تقنيات الكشف عن الشذوذ الخاضع للإشراف مجموعة بيانات تم تصنيفها على أنها "طبيعية" و "غير طبيعية" وتتضمن تدريب مصنف (الاختلاف الرئيسي في العديد من مشكلات التصنيف الإحصائي الأخرى هو الطبيعة غير المتوازنة بطبيعتها للكشف عن الانحراف). تُنشئ تقنيات الكشف عن الشذوذ الخاضع للإشراف نموذجًا يمثل السلوك الطبيعي من مجموعة بيانات تدريب عادية معينة ، ثم تختبر احتمالية إنشاء مثيل اختبار بواسطة النموذج.

تعلم الروبوت

التعلم الآلي مستوحى من العديد من أساليب التعلم الآلي ، بدءًا من التعلم الخاضع للإشراف والتعلم المعزز ، [58] [59] وأخيرًا التعلم التلوي (مثل MAML).

قواعد الرابطة

تعلم قواعد الرابطة هو أسلوب تعلم آلي قائم على القواعد لاكتشاف العلاقات بين المتغيرات في قواعد البيانات الكبيرة. الغرض منه هو تحديد القواعد القوية التي تم اكتشافها في قواعد البيانات باستخدام بعض مقاييس "الاهتمام". [60]

التعلم الآلي القائم على القواعد هو مصطلح عام لأي طريقة تعلم آلي تحدد "القواعد" أو تتعلمها أو تطورها لتخزين المعرفة أو معالجتها أو تطبيقها. السمة المميزة لخوارزمية التعلم الآلي المستندة إلى القواعد هي تحديد واستخدام مجموعة من القواعد العلائقية التي تمثل بشكل جماعي المعرفة التي يلتقطها النظام. هذا على عكس خوارزميات التعلم الآلي الأخرى التي تحدد نموذجًا فرديًا يمكن تطبيقه عالميًا على أي حالة من أجل إجراء تنبؤ. [61] تشمل مناهج التعلم الآلي القائمة على القواعد أنظمة تصنيف التعلم وتعلم قواعد الارتباط وأنظمة المناعة الاصطناعية .

واستنادا إلى مفهوم قواعد قوية، راكيش أغراوال ، توماسز إيميلينسكي قدم وارون سوامي قواعد رابطة لاكتشاف الاطراد بين المنتجات في بيانات المعاملات واسعة النطاق التي سجلتها نقاط البيع (POS) نظم في محلات السوبر ماركت. [62] على سبيل المثال القاعدةالموجودة في بيانات مبيعات السوبر ماركت تشير إلى أنه إذا اشترى العميل البصل والبطاطس معًا ، فمن المحتمل أيضًا أن يشتري لحم الهامبرغر. يمكن استخدام هذه المعلومات كأساس لاتخاذ قرارات بشأن الأنشطة التسويقية مثل التسعير الترويجي أو مواضع المنتجات . بالإضافة إلى تحليل سلة السوق ، يتم استخدام قواعد الارتباط اليوم في مجالات التطبيق بما في ذلك التنقيب عن استخدام الويب ، وكشف التسلل ، والإنتاج المستمر ، والمعلوماتية الحيوية . على عكس التعدين المتسلسل ، لا يأخذ تعلم قواعد الارتباط عادةً في الاعتبار ترتيب العناصر سواء داخل المعاملة أو عبر المعاملات.

تعلم نظم المصنف (LCS) هي عائلة من خوارزميات تعلم الآلة على أساس القاعدة التي تجمع بين عنصر الاكتشاف، عادة الخوارزمية الجينية ، التي تحتوي على عنصر التعلم، وأداء إما يشرف التعلم ، تعزيز التعلم ، أو التعلم غير خاضعة للرقابة . إنهم يسعون إلى تحديد مجموعة من القواعد التي تعتمد على السياق والتي تقوم بشكل جماعي بتخزين المعرفة وتطبيقها بطريقة متعددة الأجزاء من أجل إجراء تنبؤات. [63]

البرمجة المنطقية الاستقرائية (ILP) هي نهج لتعلم القواعد باستخدام البرمجة المنطقية كتمثيل موحد لأمثلة المدخلات والمعرفة الأساسية والفرضيات. بالنظر إلى ترميز المعرفة الخلفية المعروفة ومجموعة من الأمثلة الممثلة كقاعدة بيانات منطقية للحقائق ، سيشتق نظام ILP برنامج منطق مفترض يتضمن جميع الأمثلة الإيجابية وغير السلبية. البرمجة الاستقرائية هي مجال ذو صلة يأخذ في الاعتبار أي نوع من لغات البرمجة لتمثيل الفرضيات (وليس فقط البرمجة المنطقية) ، مثل البرامج الوظيفية .

برمجة المنطق الاستقرائي مفيدة بشكل خاص في المعلوماتية الحيوية و معالجة اللغة الطبيعية . جوردون بلوتكين و إيهود شابيرو وضعت الأساس النظري الأولي للتعلم آلة الاستقرائي في إطار منطقي. [64] [65] [66] قام شابيرو ببناء أول تطبيق له (نموذج نظام الاستدلال) في عام 1981: برنامج Prolog الذي استنتج برامج المنطق بشكل استقرائي من الأمثلة الإيجابية والسلبية. [67] يشير المصطلح الاستقرائي هنا إلى الاستقراء الفلسفي ، مما يقترح نظرية لشرح الحقائق المرصودة ، بدلاً من الاستقراء الرياضي، إثبات الملكية لجميع أعضاء مجموعة جيدة الترتيب.

النماذج

يتضمن أداء التعلم الآلي إنشاء نموذج يتم تدريبه على بعض بيانات التدريب ومن ثم يمكنه معالجة بيانات إضافية لعمل تنبؤات. تم استخدام أنواع مختلفة من النماذج والبحث فيها لأنظمة التعلم الآلي.

الشبكات العصبية الاصطناعية

الشبكة العصبية الاصطناعية هي مجموعة مترابطة من العقد ، تشبه الشبكة الواسعة من الخلايا العصبية في الدماغ . هنا ، تمثل كل عقدة دائرية خلية عصبية اصطناعية ويمثل السهم اتصالًا من إخراج خلية عصبية اصطناعية إلى مدخلات أخرى.

الشبكات العصبية الاصطناعية (ANNs) ، أو أنظمة التوصيل ، هي أنظمة حسابية مستوحاة بشكل غامض من الشبكات العصبية البيولوجية التي تشكل أدمغة الحيوانات . مثل هذه الأنظمة "تتعلم" أداء المهام من خلال النظر في الأمثلة ، بشكل عام دون أن تتم برمجتها مع أي قواعد خاصة بالمهمة.

ANN هو نموذج يعتمد على مجموعة من الوحدات أو العقد المتصلة تسمى " الخلايا العصبية الاصطناعية " ، والتي تشكل نموذجًا غير محكم للخلايا العصبية في الدماغ البيولوجي . كل وصلة ، مثل نقاط الاشتباك العصبي في الدماغ البيولوجي ، يمكن أن تنقل المعلومات ، "إشارة" ، من خلية عصبية اصطناعية إلى أخرى. يمكن للخلايا العصبية الاصطناعية التي تتلقى إشارة معالجتها ومن ثم إرسال إشارات إلى خلايا عصبية اصطناعية إضافية متصلة بها. في تطبيقات ANN الشائعة ، تكون الإشارة عند الاتصال بين الخلايا العصبية الاصطناعية رقمًا حقيقيًا، ويتم حساب ناتج كل خلية عصبية اصطناعية بواسطة بعض الوظائف غير الخطية لمجموع مدخلاتها. تسمى الروابط بين الخلايا العصبية الاصطناعية "الحواف". عادةً ما يكون للخلايا العصبية والحواف الاصطناعية وزن يتكيف مع تقدم التعلم. يزيد الوزن أو ينقص من قوة الإشارة عند الاتصال. قد يكون للخلايا العصبية الاصطناعية عتبة بحيث يتم إرسال الإشارة فقط إذا تجاوزت الإشارة المجمعة هذه العتبة. عادة ، يتم تجميع الخلايا العصبية الاصطناعية في طبقات. قد تؤدي الطبقات المختلفة أنواعًا مختلفة من التحويلات على مدخلاتها. تنتقل الإشارات من الطبقة الأولى (طبقة الإدخال) إلى الطبقة الأخيرة (طبقة الإخراج) ، ربما بعد اجتياز الطبقات عدة مرات.

كان الهدف الأصلي لنهج ANN هو حل المشكلات بنفس الطريقة التي يفعل بها الدماغ البشري . ومع ذلك ، مع مرور الوقت ، تحول الانتباه إلى أداء مهام محددة ، مما أدى إلى انحرافات عن علم الأحياء . وقد استخدمت الشبكات العصبية الاصطناعية على مجموعة متنوعة من المهام، بما في ذلك رؤية الكمبيوتر ، التعرف على الكلام ، الترجمة الآلية ، شبكة اجتماعية الترشيح، و لعب المجلس وألعاب الفيديو و التشخيص الطبي .

يتكون التعلم العميق من عدة طبقات مخفية في شبكة عصبية اصطناعية. يحاول هذا النهج نمذجة الطريقة التي يعالج بها الدماغ البشري الضوء والصوت في الرؤية والسمع. بعض التطبيقات الناجحة للتعليم عميق و رؤية الكمبيوتر و التعرف على الكلام . [68]

أشجار القرار

يستخدم التعلم شجرة قرار شجرة القرار بمثابة نموذج تنبؤي للانتقال من الملاحظات حول بند (ممثلة في فروع) إلى استنتاجات حول قيمة الهدف القطعة (ممثلة في الأوراق). إنه أحد أساليب النمذجة التنبؤية المستخدمة في الإحصاء واستخراج البيانات والتعلم الآلي. نماذج الشجرة حيث يمكن أن يأخذ المتغير الهدف مجموعة منفصلة من القيم تسمى أشجار التصنيف ؛ في هذه الهياكل الشجرية ، تمثل الأوراق تسميات الفئات والفروع تمثل اقترانات السمات التي تؤدي إلى تسميات الفئات تلك. أشجار القرار حيث يمكن أن يأخذ المتغير الهدف قيمًا مستمرة (عادةً أرقام حقيقية) تسمى أشجار الانحدار. في تحليل القرار ، يمكن استخدام شجرة القرار لتمثيل القرارات وصنع القرار بشكل مرئي وصريح . في استخراج البيانات ، تصف شجرة القرار البيانات ، ولكن يمكن أن تكون شجرة التصنيف الناتجة مدخلاً لاتخاذ القرار.

آلات ناقلات الدعم

آلات ناقلات الدعم (SVM) ، والمعروفة أيضًا باسم شبكات ناقلات الدعم ، هي مجموعة من طرق التعلم الخاضعة للإشراف ذات الصلة المستخدمة في التصنيف والانحدار. بالنظر إلى مجموعة من أمثلة التدريب ، تم وضع علامة على كل منها على أنها تنتمي إلى واحدة من فئتين ، فإن خوارزمية تدريب SVM تبني نموذجًا يتنبأ بما إذا كان المثال الجديد يندرج في فئة واحدة أو أخرى. [69] خوارزمية تدريب أحد SVM هي غير احتمالي ، ثنائي ، المصنف الخطي ، على الرغم من أن وسائل مثل بلات القياس الموجودة لاستخدام SVM في إعداد تصنيف احتمالي. بالإضافة إلى إجراء التصنيف الخطي ، يمكن أن تقوم SVM بكفاءة بإجراء تصنيف غير خطي باستخدام ما يسمى بـخدعة kernel ، تعيين مدخلاتهم ضمنيًا في فضاءات الميزات عالية الأبعاد.

رسم توضيحي للانحدار الخطي في مجموعة بيانات.

تحليل الانحدار

يشمل تحليل الانحدار مجموعة كبيرة ومتنوعة من الأساليب الإحصائية لتقدير العلاقة بين متغيرات الإدخال والسمات المرتبطة بها. شكله الأكثر شيوعًا هو الانحدار الخطي ، حيث يتم رسم خط واحد ليلائم البيانات المعطاة بشكل أفضل وفقًا لمعيار رياضي مثل المربعات الصغرى العادية . غالبًا ما يتم تمديد هذا الأخير من خلال طرق التنظيم (الرياضيات) للتخفيف من التحيز والتحيز ، كما هو الحال في انحدار التلال . عند التعامل مع المشكلات غير الخطية ، تشتمل نماذج go-to على الانحدار متعدد الحدود (على سبيل المثال ، يُستخدم لملاءمة خط الاتجاه في Microsoft Excel [70] ) ، والانحدار اللوجستي (غالبًا ما يستخدم فيالتصنيف الإحصائي ) أو حتى انحدار النواة ، والذي يقدم اللاخطية من خلال الاستفادة من خدعة النواة لتعيين متغيرات الإدخال ضمنيًا إلى مساحة ذات أبعاد أعلى.

شبكات بايزي

شبكة بايزي بسيطة. يؤثر المطر على ما إذا كان الرشاش نشطًا ، ويؤثر كل من المطر والرش على ما إذا كان العشب رطبًا.

شبكة النظرية الافتراضية، شبكة المعتقد، أو إخراج نموذج بياني احلقي هو احتمالي نموذج الرسومية التي تمثل مجموعة من المتغيرات العشوائية وعلى استقلال مشروط مع الرسم البياني احلقي موجهة (DAG). على سبيل المثال ، يمكن أن تمثل شبكة بايز العلاقات الاحتمالية بين الأمراض والأعراض. بالنظر إلى الأعراض ، يمكن استخدام الشبكة لحساب احتمالات وجود أمراض مختلفة. توجد خوارزميات فعالة تؤدي الاستدلال والتعلم. الشبكات البايزية التي تصمم تسلسل المتغيرات ، مثل إشارات الكلام أو تسلسل البروتين ، تسمى شبكات بايز الديناميكية. تسمى تعميمات شبكات بايز التي يمكن أن تمثل وتحل مشاكل القرار في ظل عدم اليقين مخططات التأثير .

الخوارزميات الجينية

A الخوارزمية الجينية (GA) هي خوارزمية البحث و الكشف عن مجريات الأمور التقنية التي يحاكي عملية الانتقاء الطبيعي ، وذلك باستخدام أساليب مثل طفرة و كروس لتوليد جديدة المورثات على أمل إيجاد حلول جيدة لمشكلة معينة. في التعلم الآلي ، تم استخدام الخوارزميات الجينية في الثمانينيات والتسعينيات. [71] [72] على العكس من ذلك ، تم استخدام تقنيات التعلم الآلي لتحسين أداء الخوارزميات الجينية والتطورية . [73]

نماذج التدريب

عادة ، تتطلب نماذج التعلم الآلي الكثير من البيانات حتى تعمل بشكل جيد. عادة ، عند تدريب نموذج التعلم الآلي ، يحتاج المرء إلى جمع عينة كبيرة تمثيلية من البيانات من مجموعة التدريب. يمكن أن تتنوع البيانات من مجموعة التدريب مثل مجموعة النصوص ومجموعة الصور والبيانات التي تم جمعها من المستخدمين الفرديين للخدمة. التجهيز الزائد هو شيء يجب الانتباه إليه عند تدريب نموذج التعلم الآلي. يمكن أن تؤدي النماذج المدربة المستمدة من البيانات المتحيزة إلى تنبؤات منحرفة أو غير مرغوب فيها. التحيز الحسابي هو نتيجة محتملة من البيانات غير المعدة بالكامل للتدريب.

التعلم المتحد

التعلم الموحد هو شكل مُكيف من الذكاء الاصطناعي الموزع لتدريب نماذج التعلم الآلي التي تعمل على إضفاء اللامركزية على عملية التدريب ، مما يسمح بالحفاظ على خصوصية المستخدمين من خلال عدم الحاجة إلى إرسال بياناتهم إلى خادم مركزي. يؤدي هذا أيضًا إلى زيادة الكفاءة من خلال إضفاء اللامركزية على عملية التدريب للعديد من الأجهزة. على سبيل المثال ، يستخدم Gboard التعلم الآلي الموحد لتدريب نماذج التنبؤ بطلبات البحث على الهواتف المحمولة للمستخدمين دون الحاجة إلى إرسال عمليات البحث الفردية مرة أخرى إلى Google . [74]

التطبيقات

هناك العديد من التطبيقات للتعلم الآلي ، بما في ذلك:

في عام 2006 ، عقد مزود خدمات الوسائط Netflix أول مسابقة " جائزة Netflix " للعثور على برنامج للتنبؤ بشكل أفضل بتفضيلات المستخدم وتحسين دقة خوارزمية توصية أفلام Cinematch الحالية بنسبة 10٪ على الأقل. قام فريق مشترك مكون من باحثين من AT&T Labs -Research بالتعاون مع فرق Big Chaos و Pragmatic Theory ببناء نموذج جماعي للفوز بالجائزة الكبرى في عام 2009 مقابل مليون دولار. [76] بعد منح الجائزة بفترة وجيزة ، أدركت Netflix أن تقييمات المشاهدين لم تكن أفضل مؤشرات لأنماط المشاهدة ("كل شيء هو توصية") وقاموا بتغيير محرك توصياتهم وفقًا لذلك. [77]في عام 2010 ، كتبت صحيفة وول ستريت جورنال عن شركة Rebellion Research واستخدامها للتعلم الآلي للتنبؤ بالأزمة المالية. [78] في عام 2012 ، توقع المؤسس المشارك لشركة Sun Microsystems ، فينود خوسلا ، أن 80٪ من وظائف الأطباء ستضيع في العقدين المقبلين بسبب برامج التشخيص الطبي للتعلم الآلي. [79] في عام 2014 ، تم الإبلاغ عن تطبيق خوارزمية التعلم الآلي في مجال تاريخ الفن لدراسة اللوحات الفنية الجميلة وأنه قد يكون قد كشف عن تأثيرات غير معترف بها سابقًا بين الفنانين. [80] في عام 2019 ، نشرت Springer Nature أول كتاب بحثي تم إنشاؤه باستخدام التعلم الآلي. [81]في عام 2020 ، تم استخدام تقنية التعلم الآلي للمساعدة في إجراء التشخيصات ومساعدة الباحثين في تطوير علاج لـ COVID-19. [82] تم تطبيق التعلم الآلي مؤخرًا للتنبؤ بالسلوك الأخضر للإنسان. [83] في الآونة الأخيرة ، يتم أيضًا تطبيق تقنية التعلم الآلي لتحسين أداء الهاتف الذكي والسلوك الحراري بناءً على تفاعل المستخدم مع الهاتف. [84] [85]

القيود

على الرغم من أن التعلم الآلي كان تحويليًا في بعض المجالات ، إلا أن برامج التعلم الآلي غالبًا ما تفشل في تحقيق النتائج المتوقعة. [86] [87] [88] أسباب ذلك عديدة: نقص البيانات (المناسبة) ، قلة الوصول إلى البيانات ، تحيز البيانات ، مشاكل الخصوصية ، المهام والخوارزميات المختارة بشكل سيئ ، الأدوات والأشخاص الخاطئين ، نقص الموارد ، ومشاكل التقييم. [89]

في عام 2018 ، فشلت سيارة ذاتية القيادة من أوبر في رصد أحد المشاة الذي قُتل بعد اصطدامه. [90] فشلت محاولات استخدام التعلم الآلي في الرعاية الصحية مع نظام IBM Watson في تحقيق ذلك حتى بعد سنوات من الوقت واستثمار مليارات الدولارات. [91] [92]

تم استخدام التعلم الآلي كإستراتيجية لتحديث الأدلة المتعلقة بالمراجعة المنهجية وزيادة عبء المراجع المرتبط بنمو الأدبيات الطبية الحيوية. في حين أنه قد تحسن مع مجموعات التدريب ، إلا أنه لم يتطور بشكل كافٍ لتقليل عبء العمل دون الحد من الحساسية اللازمة لنتائج البحث نفسها. [93]

تحيز

يمكن أن تعاني مناهج التعلم الآلي على وجه الخصوص من تحيزات البيانات المختلفة. قد لا يتمكن نظام التعلم الآلي المُدرَّب تحديدًا على العملاء الحاليين من التنبؤ باحتياجات مجموعات العملاء الجدد غير الممثلة في بيانات التدريب. عند التدريب على البيانات التي من صنع الإنسان ، من المرجح أن يلتقط التعلم الآلي التحيزات الدستورية واللاواعية الموجودة بالفعل في المجتمع. [94] تم إثبات أن النماذج اللغوية المستفادة من البيانات تحتوي على تحيزات شبيهة بالإنسان. [95] [96] تم العثور على أنظمة التعلم الآلي المستخدمة لتقييم المخاطر الجنائية متحيزة ضد السود. [97] [98] في عام 2015 ، غالبًا ما كانت صور Google تشير إلى السود على أنهم غوريلا ، [99]وفي عام 2018 ، لم يتم حل هذا الأمر بشكل جيد ، ولكن ورد أن Google كانت لا تزال تستخدم الحل البديل لإزالة جميع الغوريلا من بيانات التدريب ، وبالتالي لم تكن قادرة على التعرف على الغوريلا الحقيقية على الإطلاق. [100] تم العثور على مشكلات مماثلة في التعرف على الأشخاص غير البيض في العديد من الأنظمة الأخرى. [101] في عام 2016 ، اختبرت مايكروسوفت روبوت محادثة تعلم من تويتر ، وسرعان ما التقط لغة عنصرية وجنسية. [102] بسبب هذه التحديات ، قد يستغرق الاستخدام الفعال للتعلم الآلي وقتًا أطول ليتم اعتماده في مجالات أخرى. [103] الاهتمام بالعدالةفي التعلم الآلي ، أي تقليل التحيز في التعلم الآلي ودفع استخدامه لصالح الإنسان يتم التعبير عنه بشكل متزايد من قبل علماء الذكاء الاصطناعي ، بما في ذلك Fei-Fei Li ، الذي يذكر المهندسين بأنه "لا يوجد شيء مصطنع حول الذكاء الاصطناعي ... إنه مستوحى من الناس ، تم إنشاؤها بواسطة الأشخاص ، والأهم من ذلك أنها تؤثر على الأشخاص. إنها أداة قوية ما زلنا في بداية فهمها للتو ، وهذه مسؤولية عميقة ". [104]

تجهيز

يمكن أن يكون الخط الأزرق مثالاً على احتواء دالة خطية بسبب الضوضاء العشوائية.

يُعرف الاستقرار على نظرية سيئة ومعقدة للغاية تم التلاعب بها لتلائم جميع بيانات التدريب السابقة باسم overfitting . تحاول العديد من الأنظمة تقليل التخصيص الزائد عن طريق مكافأة النظرية وفقًا لمدى ملاءمتها للبيانات ، ولكن معاقبة النظرية وفقًا لمدى تعقيد النظرية. [9]

قيود أخرى

يمكن أن يخيب المتعلمون أيضًا من خلال "تعلم الدرس الخطأ". مثال على لعبة هو أن مصنف الصور الذي تم تدريبه فقط على صور الخيول البنية والقطط السوداء قد يستنتج أن جميع البقع البنية من المحتمل أن تكون خيول. [105] من الأمثلة الواقعية أنه ، على عكس البشر ، لا تصدر المصنفات الحالية للصور غالبًا أحكامًا من العلاقة المكانية بين مكونات الصورة ، ويتعلمون العلاقات بين وحدات البكسل التي لا يدركها البشر ، ولكنها لا تزال مرتبطة بصور لأنواع معينة من الأشياء الحقيقية. يمكن أن يؤدي تعديل هذه الأنماط على صورة شرعية إلى صور "معارضة" يخطئ النظام في تصنيفها. [106] [107]

يمكن أن تؤدي الثغرات العدائية أيضًا إلى أنظمة غير خطية ، أو من اضطرابات غير نمطية. بعض الأنظمة هشة للغاية لدرجة أن تغيير وحدة بكسل معادية واحدة يؤدي بشكل متوقع إلى سوء التصنيف.

تقييمات النموذج

يمكن التحقق من صحة تصنيف نماذج التعلم الآلي من خلال تقنيات تقدير الدقة مثل طريقة الانتظار ، والتي تقسم البيانات في مجموعة تدريب واختبار (تقليديًا 2/3 مجموعة تدريب وتعيين مجموعة اختبار 1/3) وتقييم أداء نموذج التدريب في مجموعة الاختبار. في المقارنة ، تقوم طريقة K-fold- cross-Validation بتقسيم البيانات بشكل عشوائي إلى مجموعات فرعية K ثم يتم إجراء تجارب K على التوالي مع الأخذ في الاعتبار مجموعة فرعية واحدة للتقييم ومجموعات K-1 الفرعية المتبقية لتدريب النموذج. بالإضافة إلى طرق التعليق والتحقق المتقاطع ، يمكن استخدام bootstrap ، الذي يأخذ عينات n من الحالات مع الاستبدال من مجموعة البيانات ، لتقييم دقة النموذج. [108]

بالإضافة إلى الدقة الشاملة ، كثيرًا ما يبلغ المحققون عن الحساسية والخصوصية التي تعني المعدل الإيجابي الحقيقي (TPR) والمعدل السلبي الحقيقي (TNR) على التوالي. وبالمثل ، يقوم المحققون أحيانًا بالإبلاغ عن المعدل الإيجابي الخاطئ (FPR) وكذلك المعدل السلبي الخاطئ (FNR). ومع ذلك ، فإن هذه المعدلات هي نسب لا تكشف عن البسط والمقام. تعد خاصية التشغيل الإجمالية (TOC) طريقة فعالة للتعبير عن القدرة التشخيصية للنموذج. يظهر جدول المحتويات (TOC) البسط والمقام للمعدلات المذكورة سابقًا ، وبالتالي يوفر جدول المحتويات (TOC) معلومات أكثر من خاصية تشغيل المستقبل الشائعة الاستخدام (ROC) والمنطقة المرتبطة بـ ROC تحت المنحنى (AUC). [109]

الأخلاق

يطرح التعلم الآلي مجموعة من الأسئلة الأخلاقية . قد تُظهر الأنظمة التي يتم تدريبها على مجموعات البيانات التي تم جمعها مع التحيزات هذه التحيزات عند الاستخدام ( التحيز الحسابي ) ، وبالتالي رقمنة التحيزات الثقافية. [110] على سبيل المثال ، في عام 1988 ، وجدت لجنة المملكة المتحدة للمساواة العرقية أن كلية الطب في سانت جورج كانت تستخدم برنامج كمبيوتر تم تدريبه من بيانات موظفي القبول السابقين وأن هذا البرنامج رفض ما يقرب من 60 مرشحًا تبين أنهم إما نساء أو لديها أسماء تبدو غير أوروبية. [94] قد يؤدي استخدام بيانات التوظيف من شركة ذات سياسات توظيف عنصرية إلى نظام تعلم آلي يكرر التحيز من خلال تسجيل المتقدمين للوظائف بالتشابه مع المتقدمين الناجحين السابقين. [111][112] وبالتالي فإن الجمع المسؤول للبيانات وتوثيق القواعد الحسابية المستخدمة من قبل النظام هو جزء مهم من التعلم الآلي.

يمكن أن يكون الذكاء الاصطناعي مجهزًا جيدًا لاتخاذ القرارات في المجالات التقنية ، والتي تعتمد بشكل كبير على البيانات والمعلومات التاريخية. تعتمد هذه القرارات على الموضوعية والتفكير المنطقي. [113] لأن اللغات البشرية تحتوي على التحيز، وآلات تدريب على اللغة المجاميع وبالضرورة أيضا تعلم هذه التحيزات. [114] [115]

أشكال أخرى من التحديات الأخلاقية ، لا تتعلق بالتحيزات الشخصية ، شوهدت في الرعاية الصحية. هناك مخاوف بين المتخصصين في الرعاية الصحية من أن هذه الأنظمة قد لا تكون مصممة لمصلحة الجمهور ولكن كآلات مدرة للدخل. [116] هذا صحيح بشكل خاص في الولايات المتحدة حيث توجد معضلة أخلاقية طويلة الأمد لتحسين الرعاية الصحية ، ولكن أيضًا زيادة الأرباح. على سبيل المثال ، يمكن تصميم الخوارزميات لتزويد المرضى باختبارات غير ضرورية أو دواء يمتلك فيه مالكو الخوارزمية حصصًا. هناك إمكانية للتعلم الآلي في مجال الرعاية الصحية لتزويد المتخصصين بأداة إضافية لتشخيص وعلاج وتخطيط مسارات التعافي للمرضى ، ولكن هذا يتطلب التخفيف من هذه التحيزات. [117]

الأجهزة

منذ عام 2010 ، أدت التطورات في كل من خوارزميات التعلم الآلي وأجهزة الكمبيوتر إلى أساليب أكثر فاعلية لتدريب الشبكات العصبية العميقة (مجال فرعي ضيق معين للتعلم الآلي) التي تحتوي على طبقات عديدة من الوحدات المخفية غير الخطية. [118] بحلول عام 2019 ، حلت وحدات معالجة الرسوم ( GPU ) ، غالبًا مع تحسينات خاصة بالذكاء الاصطناعي ، محل وحدات المعالجة المركزية باعتبارها الطريقة السائدة لتدريب الذكاء الاصطناعي السحابي التجاري واسع النطاق. [119] قدرت OpenAI حوسبة الأجهزة المستخدمة في أكبر مشاريع التعلم العميق من AlexNet (2012) إلى AlphaZero (2017) ، ووجدت زيادة بمقدار 300 ألف ضعف في مقدار الحوسبة المطلوبة ، مع خط اتجاه زمني مضاعف يبلغ 3.4 شهرًا. [120] [121]

الشبكات العصبية العصبية / الفيزيائية

A الشبكة العصبية المادية أو الكمبيوتر Neuromorphic هو نوع من الشبكة العصبية الاصطناعية التي تستخدم مادة قابلة للتعديل كهربائيا لمحاكاة وظيفة من المشبك العصبي . تُستخدم الشبكة العصبية "المادية" للتأكيد على الاعتماد على الأجهزة المادية المستخدمة لمحاكاة الخلايا العصبية بدلاً من الأساليب القائمة على البرامج. بشكل عام ، ينطبق المصطلح على الشبكات العصبية الاصطناعية الأخرى التي يتم فيها استخدام memristor أو مادة مقاومة أخرى قابلة للتعديل كهربائيًا لمحاكاة المشبك العصبي. [122] [123]


البرمجيات

تتضمن مجموعات البرامج التي تحتوي على مجموعة متنوعة من خوارزميات التعلم الآلي ما يلي:

برنامج مجاني ومفتوح المصدر

برمجيات احتكارية ذات إصدارات مجانية ومفتوحة المصدر

البرمجيات الاحتكارية

المجلات

المؤتمرات

انظر أيضا

المراجع

  1. ^ ميتشل ، توم (1997). تعلم الآلة . نيويورك: ماكجرو هيل. رقم ISBN 0-07-042807-7. OCLC  36417892 .
  2. ^ غالبًا ما يُنسب تعريف "بدون برمجة صريحة" إلى آرثر صموئيل ، الذي صاغ مصطلح "التعلم الآلي" في عام 1959 ، ولكن لم يتم العثور على العبارة حرفيًا في هذا المنشور ، وقد تكون إعادة صياغة ظهرت لاحقًا. يمنح "إعادة صياغة آرثر صموئيل (1959) ، السؤال هو: كيف يمكن لأجهزة الكمبيوتر أن تتعلم حل المشكلات دون أن تتم برمجتها بشكل صريح؟" في كوزا ، جون ر. بينيت ، فورست إتش. اندريه ديفيد. كين ، مارتن أ. (1996). التصميم الآلي لكل من طوبولوجيا وتحجيم الدوائر الكهربائية التناظرية باستخدام البرمجة الجينية . الذكاء الاصطناعي في التصميم 96. سبرينغر ، دوردريخت. ص 151 - 170. دوى : 10.1007 / 978-94-009-0279-4_9 .
  3. ^ هو ، ياء ؛ نيو ، ح. كاراسكو ، ياء ؛ لينوكس ، ب. Arvin ، F. ، " الاستكشاف الذاتي للروبوتات المتعددة المستندة إلى Voronoi في بيئات غير معروفة عبر التعلم العميق المعزز " معاملات IEEE على تكنولوجيا المركبات ، 2020.
  4. ^ a b c d Bishop ، CM (2006) ، التعرف على الأنماط والتعلم الآلي ، Springer ، ISBN 978-0-387-31073-2
  5. ^ التعلم الآلي والتعرف على الأنماط "يمكن اعتبارهما وجهين من نفس المجال." [4] : السابع 
  6. ^ فريدمان ، جيروم هـ. (1998). "التنقيب في البيانات والإحصاءات: ما هو الاتصال؟". علوم الحوسبة والإحصاء . 29 (1): 3-9.
  7. ^ "ما هو التعلم الآلي؟" . www.ibm.com . تم الاسترجاع 2021-08-15 .
  8. ^ تشو ، فيكتور (2019-12-20). "التعلم الآلي للمبتدئين: مقدمة للشبكات العصبية" . متوسطة . تم الاسترجاع 2021-08-15 .
  9. ^ أ ب دومينغوس 2015 ، الفصل 6 ، الفصل 7.
  10. ^ a b c Ethem Alpaydin (2020). مقدمة في التعلم الآلي (الطبعة الرابعة). معهد ماساتشوستس للتكنولوجيا . ص التاسع عشر ، 1-3 ، 13-18. رقم ISBN 978-0262043793.
  11. ^ صموئيل ، آرثر (1959). "بعض الدراسات في التعلم الآلي باستخدام لعبة الداما". مجلة آي بي إم للبحوث والتنمية . 3 (3): 210-229. سيتسيركس 10.1.1.368.2254 . دوى : 10.1147 / rd.33.0210 . 
  12. ^ R. Kohavi و F. Provost ، "مسرد المصطلحات ،" Machine Learning ، المجلد. 30 ، لا. 2-3 ، الصفحات 271-274 ، 1998.
  13. ^ جيروفيتش ، سلافا (9 أبريل 2015). "كيف حصل الكمبيوتر على انتقامه من الاتحاد السوفيتي" . نوتيلوس . تم الاسترجاع 19 سبتمبر 2021 .
  14. ^ ليندسي ، ريتشارد ب. (1 سبتمبر 1964). "تأثير الأتمتة على الإدارة العامة" . الفصلية السياسية الغربية . 17 (3): 78-81. دوى : 10.1177 / 106591296401700364 . ISSN 0043-4078 . S2CID 154021253 . تم الاسترجاع 6 أكتوبر 2021 .  
  15. ^ Nilsson N. Learning Machines ، McGraw Hill ، 1965.
  16. ^ دودا ، آر ، هارت ب.التعرف على الأنماط وتحليل المشهد ، وايلي إنترسينس 1973
  17. ^ S. Bozinovski "مساحة التدريس: مفهوم تمثيلي لتصنيف النمط التكيفي" تقرير COINS الفني رقم 81-28 ، قسم علوم الكمبيوتر والمعلومات ، جامعة ماساتشوستس في أمهيرست ، ماساتشوستس ، 1981. https: //web.cs.umass .edu / بورنشر / مستندات / 1981 / UM-CS-1981-028.pdf
  18. ^ أ ب ميتشل ، ت. (1997). تعلم الآلة . ماكجرو هيل. ص. 2. ISBN 978-0-07-042807-2.
  19. ^ هارناد ، ستيفان (2008) ، "The Annotation Game: On Turing (1950) on Computing، Machinery، and Intelligence" ، in Epstein، Robert؛ بيترز ، جريس (محرران) ، كتاب اختبار تورينج: القضايا الفلسفية والمنهجية في البحث عن كمبيوتر التفكير ، كلوير ، الصفحات 23-66 ، ISBN 9781402067082
  20. ^ "مقدمة إلى AI الجزء 1" . Edzion . 2020-12-08 . تم الاسترجاع 2020/12/09 .
  21. ^ "بحث علمي تجريبي حول المعلوماتية الحيوية في التعلم الآلي - مجلة" . تم الاسترجاع 28 أكتوبر 2020 . Cite journal requires |journal= (help)
  22. ^ "rasbt/stat453-deep-learning-ss20" (PDF). GitHub. 9 November 2021.
  23. ^ Sarle, Warren (1994). "Neural Networks and statistical models". CiteSeerX 10.1.1.27.699.
  24. ^ a b c d Russell, Stuart; Norvig, Peter (2003) [1995]. Artificial Intelligence: A Modern Approach (2nd ed.). Prentice Hall. ISBN 978-0137903955.
  25. ^ أ ب ج لانجلي ، بات (2011). "العلم المتغير للتعلم الآلي" . تعلم الآلة . 82 (3): 275-279. دوى : 10.1007 / s10994-011-5242-y .
  26. ^ أ ب Alpaydin ، Ethem (2010). مقدمة في تعلم الآلة . مطبعة معهد ماساتشوستس للتكنولوجيا. ص. 9. ISBN 978-0-262-01243-0.
  27. ^ أ ب مكتبة جامعة كورنيل (أغسطس 2001). "بريمان: النمذجة الإحصائية: الثقافتان (مع تعليقات ورد رد المؤلف)" . العلوم الإحصائية . 16 (3). دوى : 10.1214 / SS / 1009213726 . تم الاسترجاع 8 أغسطس 2015 .
  28. ^ أ ب جاريث جيمس ؛ دانييلا ويتن تريفور هاستي روبرت تيبشيراني (2013). مقدمة في التعلم الإحصائي . سبرينغر. ص. السابع.
  29. ^ أ ب مهري ، مهريار ؛ رستميزاده ، أفشين ؛ Talwalkar ، أميت (2012). أسس تعلم الآلة . الولايات المتحدة الأمريكية ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا. رقم ISBN 9780262018258.
  30. ^ أ ب Alpaydin ، Ethem (2010). مقدمة في تعلم الآلة . لندن: مطبعة معهد ماساتشوستس للتكنولوجيا. رقم ISBN 978-0-262-01243-0. تم الاسترجاع 4 فبراير 2017 .
  31. ^ لو رو ، نيكولاس. بنجيو ، يوشوا ؛ فيتزجيبون ، أندرو (2012). "تحسين + الأول + و + الترتيب الثاني + الأساليب + عن طريق + النمذجة + عدم اليقين & pg = PA403" تحسين طرق الترتيب الأول والثاني عن طريق نمذجة عدم اليقين " . في Sra، Suvrit؛ Nowozin، Sebastian؛ Wright، Stephen J. (محرران. ). الأمثل لآلة التعلم . MIT برس. ص 404. ISBN 9780262016469.
  32. ^ بزدوك ، دانيلو ؛ التمان ، نعومي ؛ كرزيوينسكي ، مارتن (2018). "الإحصاء مقابل التعلم الآلي" . طرق الطبيعة . 15 (4): 233-234. دوى : 10.1038 / نميث .4642 . PMC 6082636 . بميد 30100822 .  
  33. ^ أ ب مايكل جوردان (10 سبتمبر 2014). "الإحصائيات والتعلم الآلي" . رديت . تم الاسترجاع 2014/10/01 .
  34. ^ راسل ، ستيوارت جيه ؛ نورفيج ، بيتر (2010). الذكاء الاصطناعي: نهج حديث (الطبعة الثالثة). برنتيس هول. رقم ISBN 9780136042594.
  35. ^ Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Foundations of Machine Learning. The MIT Press. ISBN 9780262018258.
  36. ^ Jordan, Michael I.; Bishop, Christopher M. (2004). "Neural Networks". In Allen B. Tucker (ed.). Computer Science Handbook, Second Edition (Section VII: Intelligent Systems). Boca Raton, Florida: Chapman & Hall/CRC Press LLC. ISBN 978-1-58488-360-9.
  37. ^ Alex Ratner; Stephen Bach; Paroma Varma; Chris. "Weak Supervision: The New Programming Paradigm for Machine Learning". hazyresearch.github.io. referencing work by many other members of Hazy Research. Retrieved 2019-06-06.
  38. ^ van Otterlo, M.; Wiering, M. (2012). Reinforcement learning and markov decision processes. Reinforcement Learning. Adaptation, Learning, and Optimization. 12. pp. 3–42. doi:10.1007/978-3-642-27645-3_1. ISBN 978-3-642-27644-6.
  39. ^ science.sciencemag.org/content/290/5500/2323
  40. ^ towardsdatascience.com/all-machine-learning-models-explained-in-6-minutes-9fe30ff6776a
  41. ^ Pavel Brazdil, Christophe Giraud Carrier, Carlos Soares, Ricardo Vilalta (2009). Metalearning: Applications to Data Mining (Fourth ed.). Springer Science+Business Media. pp. 10–14, passim. ISBN 978-3540732624.CS1 maint: uses authors parameter (link)
  42. ^ Bozinovski, S. (1982). "A self-learning system using secondary reinforcement". In Trappl, Robert (ed.). Cybernetics and Systems Research: Proceedings of the Sixth European Meeting on Cybernetics and Systems Research. North Holland. pp. 397–402. ISBN 978-0-444-86488-8.
  43. ^ Bozinovski, Stevo (2014) "Modeling mechanisms of cognition-emotion interaction in artificial neural networks, since 1981." Procedia Computer Science p. 255-263
  44. ^ Bozinovski, S. (2001) "Self-learning agents: A connectionist theory of emotion based on crossbar value judgment." Cybernetics and Systems 32(6) 637-667.
  45. ^ واي بنجيو. أ. كورفيل ؛ فنسنت (2013). "تعلم التمثيل: مراجعة ووجهات نظر جديدة". معاملات IEEE على تحليل الأنماط وذكاء الآلة . 35 (8): 1798-1828. arXiv : 1206.5538 . دوى : 10.1109 / tpami.2013.50 . بميد 23787338 . S2CID 393948 .  
  46. ^ ناثان سريبرو. جايسون دي إم ريني تومي س.جاكولا (2004). عامل مصفوفة الحد الأقصى للهامش . نيبس .
  47. ^ كواتس ، آدم ؛ لي ، هونغلاك ؛ نج ، أندرو ي. (2011). تحليل الشبكات أحادية الطبقة في تعلم الميزات غير الخاضع للإشراف (PDF) . مؤتمر الأطراف الدولي. على الذكاء الاصطناعي والإحصاء (AISTATS). مؤرشف من الأصل (PDF) في 13 أغسطس 2017 . تم الاسترجاع 2018/11/25 .
  48. ^ كسوركا ، غابرييلا ؛ الرقص ، كريستوفر سي ؛ مروحة ، ليكسين. ويلاموفسكي ، جوتا ؛ براي ، سيدريك (2004). التصنيف المرئي بأكياس نقاط المفاتيح (PDF) . ورشة عمل ECCV حول التعلم الإحصائي في الرؤية الحاسوبية.
  49. ^ دانيال جورافسكي. جيمس هـ.مارتن (2009). معالجة الكلام واللغة . بيرسون الدولية للتعليم. ص 145 - 146.
  50. ^ لو هايبينغ. بلاتانيوتيس ، كن ؛ Venetsanopoulos ، AN (2011). "دراسة استقصائية لتعلم الفضاء متعدد الخطوط لبيانات الموتر" (PDF) . التعرف على الأنماط . 44 (7): 1540-1551. بيب كود : 2011PatRe..44.1540L . دوى : 10.1016 / j.patcog.2011.01.004 .
  51. ^ يوشوا بنجيو (2009). تعلم البنى العميقة للذكاء الاصطناعي . Now Publishers Inc. pp.1–3. رقم ISBN 978-1-60198-294-0.
  52. ^ تيلمان ، إيه إم (2015). "حول التعقيد الحسابي لتعلم القاموس الدقيق والتقريبي". رسائل معالجة إشارة IEEE . 22 (1): 45-49. arXiv : 1405.6664 . بيب كود : 2015ISPL ... 22 ... 45T . دوى : 10.1109 / LSP.2014.2345761 . S2CID 13342762 . 
  53. ^ أهارون ، إم ، إم إلعاد ، وآيه بروكستين. 2006. " K-SVD: خوارزمية لتصميم القواميس الكاملة للتمثيل المتناثر ." معالجة الإشارات ، معاملات IEEE على 54 (11): 4311-4322
  54. ^ Zimek, Arthur; Schubert, Erich (2017), "Outlier Detection", Encyclopedia of Database Systems, Springer New York, pp. 1–5, doi:10.1007/978-1-4899-7993-3_80719-1, ISBN 9781489979933
  55. ^ Hodge, V. J.; Austin, J. (2004). "A Survey of Outlier Detection Methodologies" (PDF). Artificial Intelligence Review. 22 (2): 85–126. CiteSeerX 10.1.1.318.4023. doi:10.1007/s10462-004-4304-y. S2CID 59941878.
  56. ^ دوكاس ، بول ؛ إرتوز ، ليفينت. كومار ، فيبين ؛ لازاريفيتش ، ألكسندر ؛ سريفاستافا ، جايدب ؛ تان ، بانج نينج (2002). "التنقيب عن البيانات للكشف عن اختراق الشبكة" (PDF) . ورشة عمل Proceedings NSF حول تعدين البيانات من الجيل التالي .
  57. ^ شاندولا ، ف. بانيرجي ، أ. كومار ، ف. (2009). "كشف الشذوذ: مسح". مسوحات الحوسبة ACM . 41 (3): 1-58. دوى : 10.1145 / 1541880.1541882 . S2CID 207172599 . 
  58. ^ "التعلم الفعال لاستكشاف الشكل اللمسي باستخدام مجموعة مستشعرات صلبة ، S. Fleer ، A. Moringen ، R. Klatzky ، H. Ritter" . دوى : 10.1371 / journal.pone.0226880 . Cite journal requires |journal= (help)
  59. ^ "الاهتمام القائم روبوت التعلم من التفاعل بطريقة اللمس، A. مورينغن، S. السخرية، G. Walck، H. ريتر" (PDF) . دوى : 10.1007 / 978-3-030-58147-3_51 . S2CID 220069113 .   Cite journal requires |journal= (help)
  60. ^ Piatetsky-Shapiro ، Gregory (1991) ، اكتشاف وتحليل وتقديم قواعد قوية ، في Piatetsky-Shapiro ، Gregory ؛ وفراولي ، وليام جيه ؛ محرران ، اكتشاف المعرفة في قواعد البيانات ، مطبعة AAAI / MIT ، كامبريدج ، ماساتشوستس.
  61. ^ Bassel, George W.; Glaab, Enrico; Marquez, Julietta; Holdsworth, Michael J.; Bacardit, Jaume (2011-09-01). "Functional Network Construction in Arabidopsis Using Rule-Based Machine Learning on Large-Scale Data Sets". The Plant Cell. 23 (9): 3101–3116. doi:10.1105/tpc.111.088153. ISSN 1532-298X. PMC 3203449. PMID 21896882.
  62. ^ أغراوال ، ر. Imieliński، T.؛ سوامي ، أ. (1993). "قواعد ارتباط التعدين بين مجموعات العناصر في قواعد البيانات الكبيرة". وقائع المؤتمر الدولي ACM SIGMOD لعام 1993 حول إدارة البيانات - SIGMOD '93 . ص. 207. CiteSeerX 10.1.1.40.6984 . دوى : 10.1145 / 170035.170072 . رقم ISBN  978-0897915922. S2CID  490415 .
  63. ^ Urbanowicz ، Ryan J. ؛ مور ، جايسون هـ. (22 سبتمبر 2009). "أنظمة تصنيف التعلم: مقدمة كاملة ومراجعة وخريطة طريق" . مجلة التطور الاصطناعي والتطبيقات . 2009 : 1-25. دوى : 10.1155 / 2009/736398 . ISSN 1687-6229 . 
  64. ^ طرق Plotkin GD التلقائية للاستدلال الاستقرائي ، أطروحة دكتوراه ، جامعة إدنبرة ، 1970.
  65. ^ شابيرو ، إيهود واي.الاستدلال الاستقرائي للنظريات من الحقائق ، تقرير البحث 192 ، جامعة ييل ، قسم علوم الكمبيوتر ، 1981. أعيد طبعه في J.-L. Lassez، G. Plotkin (Eds.)، Computational Logic، The MIT Press، Cambridge، MA، 1991، pp.199–254.
  66. ^ Shapiro, Ehud Y. (1983). Algorithmic program debugging. Cambridge, Mass: MIT Press. ISBN 0-262-19218-7
  67. ^ Shapiro, Ehud Y. "The model inference system." Proceedings of the 7th international joint conference on Artificial intelligence-Volume 2. Morgan Kaufmann Publishers Inc., 1981.
  68. ^ Honglak Lee, Roger Grosse, Rajesh Ranganath, Andrew Y. Ng. "Convolutional Deep Belief Networks for Scalable Unsupervised Learning of Hierarchical Representations" Proceedings of the 26th Annual International Conference on Machine Learning, 2009.
  69. ^ كورتيس ، كورينا ؛ فابنيك ، فلاديمير ن. (1995). "شبكات دعم ناقلات" . تعلم الآلة . 20 (3): 273–297. دوى : 10.1007 / BF00994018 .
  70. ^ ستيفنسون ، كريستوفر. "البرنامج التعليمي: الانحدار متعدد الحدود في Excel" . facultystaff.richmond.edu . تم الاسترجاع 22 يناير 2017 .
  71. ^ غولدبرغ ، ديفيد إي. هولندا ، جون هـ. (1988). "الخوارزميات الجينية والتعلم الآلي" (PDF) . تعلم الآلة . 3 (2): 95-99. دوى : 10.1007 / bf00113892 . S2CID 35506513 .  
  72. ^ ميتشي ، د. سبيجلهلتر ، دي جي ؛ تايلور ، سي سي (1994). "التعلم الآلي والتصنيف العصبي والإحصائي". سلسلة إليس هوروود في الذكاء الاصطناعي . بيب كود : 1994mlns.book ..... M .
  73. ^ تشانغ ، جون. زان ، تشي-هوي ؛ لين ، ينغ تشين ، ني ؛ غونغ ، يوي جياو ؛ تشونغ ، جينغ هوي ؛ تشونج ، هنري إس إتش ؛ لي ، يون شي ، يو-هوي (2011). "الحساب التطوري يلبي التعلم الآلي: دراسة استقصائية". مجلة الذكاء الحسابي . 6 (4): 68-75. دوى : 10.1109 / mci.2011.942584 . S2CID 6760276 . 
  74. ^ "التعلم الموحد: التعلم الآلي التعاوني بدون بيانات تدريب مركزية" . مدونة جوجل AI . تم الاسترجاع 2019/06/08 .
  75. ^ يتم تضمين التعلم الآلي في منهج CFA (المناقشة من أعلى إلى أسفل) ؛ انظر: كاثلين دي روز وكريستوف لو لانو (2020). "التعلم الآلي" .
  76. ^ "صفحة BelKor الرئيسية" research.att.com
  77. ^ "مدونة Netflix Tech: توصيات Netflix: ما وراء الخمس نجوم (الجزء الأول)" . 2012-04-06. مؤرشفة من الأصلي في 31 مايو 2016 . تم الاسترجاع 8 أغسطس 2015 .
  78. ^ سكوت باترسون (13 يوليو 2010). "ترك الآلات تقرر" . صحيفة وول ستريت جورنال . تم الاسترجاع 24 يونيو 2018 .
  79. ^ فينود خوسلا (10 يناير 2012). "هل نحتاج إلى أطباء أم خوارزميات؟" . أزمة التكنولوجيا.
  80. ^ عندما درست خوارزمية التعلم الآلي لوحات الفنون الجميلة ، رأت أشياء لم يلاحظها مؤرخو الفن أبدًا ، الفيزياء في مدونة ArXiv
  81. ^ فينسينت ، جيمس (10 أبريل 2019). "يُظهر أول كتاب مدرسي تم إنشاؤه بواسطة الذكاء الاصطناعي ما يجيده الكتاب الآليون بالفعل" . الحافة . تم الاسترجاع 2019-05-05 .
  82. ^ راجو فايشيا ؛ جاويد ، محمد ؛ خان وإبراهيم حليم ؛ حليم ، عابد (1 يوليو 2020). "تطبيقات الذكاء الاصطناعي (AI) لوباء COVID-19" . مرض السكري ومتلازمة التمثيل الغذائي: البحوث السريرية والمراجعات . 14 (4): 337-339. دوى : 10.1016 / j.dsx.2020.04.012 . PMC 7195043 . بميد 32305024 .  
  83. ^ Rezapouraghdam ، حامد ؛ أخشيك ، أراش ؛ رامكيسون ، هايوانتي (10 مارس 2021). "تطبيق التعلم الآلي للتنبؤ بالسلوك الأخضر للزوار في المناطق البحرية المحمية: أدلة من قبرص" . مجلة السياحة المستدامة : 1-25. دوى : 10.1080 / 09669582.2021.1887878 .
  84. ^ كويستيد ، توني. "الهواتف الذكية تصبح أكثر ذكاءً مع ابتكار Essex | Business Weekly | أخبار التكنولوجيا | أخبار الأعمال | كامبريدج وشرق إنجلترا" . www.businessweekly.co.uk . تم الاسترجاع 2021/06/17 .
  85. ^ وليامز ، ريانون (21 يوليو 2020). "الهواتف الذكية المستقبل" سوف يطيل عمر البطارية الخاصة بهم من خلال مراقبة أصحاب السلوك " " . أنا (جريدة) . تم الاسترجاع 2021/06/17 .
  86. ^ "لماذا تفشل نماذج التعلم الآلي في كثير من الأحيان في التعلم: أسئلة وأجوبة QuickTake" . بلومبرج . 2016-11-10. مؤرشفة من الأصلي في 20 مارس 2017 . تم الاسترجاع 2017/04/10 .
  87. ^ "الموجة الأولى من الذكاء الاصطناعي للشركات محكوم عليها بالفشل" . هارفارد بيزنس ريفيو . 2017-04-18 . تم الاسترجاع 2018/08/20 .
  88. ^ "لماذا نشوة الذكاء الاصطناعي محكوم عليها بالفشل" . VentureBeat . 2016/09/18 . تم الاسترجاع 2018/08/20 .
  89. ^ "9 أسباب لفشل مشروع التعلم الآلي الخاص بك" . www.kdnuggets.com . تم الاسترجاع 2018/08/20 .
  90. ^ "لماذا قتلت سيارة أوبر ذاتية القيادة أحد المشاة" . الإيكونوميست . تم الاسترجاع 2018/08/20 .
  91. ^ "أوصى واتسون من شركة IBM بعلاجات السرطان" غير الآمنة وغير الصحيحة "- STAT" . STAT . 2018-07-25 . تم الاسترجاع 2018/08/21 .
  92. ^ هيرنانديز ، دانييلا ؛ غرينوالد ، تيد (2018-08-11). "آي بي إم لديها معضلة واتسون" . وول ستريت جورنال . ISSN 0099-9660 . تم الاسترجاع 2018/08/21 . 
  93. ^ ريدي ، شيفاني م. باتيل ، شيلا ؛ ويريش ، ميغان ؛ فينتون ، جوشوا ؛ فيسواناثان ، ميرا (2020). "مقارنة بين نهج المراجعة المنهجية التقليدية مع مراجعة المراجعات وشبه الأتمتة كاستراتيجيات لتحديث الأدلة" . مراجعات منهجية . 9 (1): 243. دوى : 10.1186 / s13643-020-01450-2 . ISSN 2046-4053 . PMC 7574591 . بميد 33076975 .   
  94. ^ أ ب جارسيا ، ميغان (2016). "عنصري في الآلة". مجلة السياسة العالمية . 33 (4): 111-117. دوى : 10.1215 / 07402775-3813015 . ISSN 0740-2775 . S2CID 151595343 .  
  95. ^ كاليسكان ، أيلين ؛ بريسون ، جوانا جيه ؛ نارايانان ، أرفيند (14 أبريل 2017). "الدلالات المشتقة تلقائيًا من مجموعات اللغة تحتوي على تحيزات شبيهة بالإنسان". علم . 356 (6334): 183-186. arXiv : 1608.07187 . بيب كود : 2017Sci ... 356..183C . دوى : 10.1126 / العلوم.ال 4230 . ISSN 0036-8075 . بميد 28408601 . S2CID 23163324 .   
  96. ^ وانج شينان. Dasgupta ، Sanjoy (2016) ، Lee ، DD ؛ سوجياما ، م. لوكسبورغ ، الأشعة فوق البنفسجية Guyon ، I. (محرران) ، "خوارزمية للبحث عن أقرب الجيران L1 عبر التضمين الرتيب" (PDF) ، التقدم في أنظمة معالجة المعلومات العصبية 29 ، Curran Associates ، Inc. ، الصفحات 983-991 ، استرجاعها 2018-08- 20
  97. ^ جوليا أنجوين جيف لارسون لورين كيرشنر سوريا ماتو (2016/05/23). "تحيز الآلة" . ProPublica . تم الاسترجاع 2018/08/20 .
  98. ^ "الرأي | عندما تساعد الخوارزمية في إرسالك إلى السجن" . نيويورك تايمز . تم الاسترجاع 2018/08/20 .
  99. ^ "جوجل تعتذر عن خطأ عنصري" . بي بي سي نيوز . 2015/07/01 . تم الاسترجاع 2018/08/20 .
  100. ^ "أصلحت Google خوارزمية عنصرية عن طريق إزالة الغوريلا من تقنية وضع العلامات على الصور الخاصة بها" . الحافة . تم الاسترجاع 2018/08/20 .
  101. ^ "رأي | مشكلة الرجل الأبيض للذكاء الاصطناعي" . نيويورك تايمز . تم الاسترجاع 2018/08/20 .
  102. ^ ميتز ، راشيل. "لماذا قال برنامج الدردشة المراهق من Microsoft ، تاي ، الكثير من الأشياء الفظيعة عبر الإنترنت" . استعراض تكنولوجيا معهد ماساتشوستس للتكنولوجيا . تم الاسترجاع 2018/08/20 .
  103. ^ سيمونيت ، توم. "تقول Microsoft أن برنامج الدردشة الآلي العنصري الخاص بها يوضح كيف أن الذكاء الاصطناعي غير قابل للتكيف بدرجة كافية لمساعدة معظم الشركات" . استعراض تكنولوجيا معهد ماساتشوستس للتكنولوجيا . تم الاسترجاع 2018/08/20 .
  104. ^ همبل ، جيسي (13-11-2018). "سعي Fei-Fei Li لجعل الآلات أفضل للبشرية" . سلكي . ISSN 1059-1028 . تم الاسترجاع 2019/02/17 . 
  105. ^ دومينغوس 2015 ، ص. 286.
  106. ^ "تغيير بكسل واحد يخدع برامج الذكاء الاصطناعي" . بي بي سي نيوز . 3 نوفمبر 2017 مؤرشفة من الأصلي في 22 مارس 2018 . تم الاسترجاع 12 مارس 2018 .
  107. ^ "الذكاء الاصطناعي لديه مشكلة هلوسة تثبت صعوبة إصلاحها" . سلكي . 2018 مؤرشفة من الأصلي في 12 مارس 2018 . تم الاسترجاع 12 مارس 2018 .
  108. ^ كوخافي ، رون (1995). "دراسة التحقق المتقاطع والتمهيد لتقدير الدقة واختيار النموذج" (PDF) . المؤتمر الدولي المشترك حول الذكاء الاصطناعي .
  109. ^ بونتيوس ، روبرت جيلمور ؛ سي ، كانغبينغ (2014). "إجمالي خصائص التشغيل لقياس القدرة التشخيصية لعتبات متعددة". المجلة الدولية لعلوم المعلومات الجغرافية . 28 (3): 570-583. دوى : 10.1080 / 13658816.2013.862623 . S2CID 29204880 . 
  110. ^ بوستروم ، نيك (2011). "أخلاقيات الذكاء الاصطناعي" (PDF) . مؤرشفة من الأصلي (PDF) في 4 مارس 2016 . تم الاسترجاع 11 أبريل 2016 .
  111. ^ إديونوي ، تولولوب. "مكافحة الخوارزميات العنصرية" . المخطط . تم الاسترجاع 17 نوفمبر 2017 .
  112. ^ جيفريز ، أدريان. "التعلم الآلي عنصري لأن الإنترنت عنصري" . المخطط . تم الاسترجاع 17 نوفمبر 2017 .
  113. ^ بوستروم ، نيك ؛ يودكوفسكي ، إليعازر (2011). "أخلاقيات الذكاء الاصطناعي" (PDF) . نيك بوستروم .
  114. ^ MOR Prates ، PHC Avelar ، LC Lamb (11 مارس 2019). "تقييم التحيز بين الجنسين في الترجمة الآلية - دراسة حالة باستخدام الترجمة من Google". arXiv : 1809.02208 [ cs.CY ].CS1 maint: uses authors parameter (link)
  115. ^ نارايانان ، آرفيند (24 أغسطس 2016). "تحتوي اللغة بالضرورة على تحيزات بشرية ، وكذلك الآلات المدربة على مجموعات اللغة" . حرية المصلح .
  116. ^ شار ، دانتون س. شاه ، نيجام هـ. ماغنوس ، ديفيد (15 مارس 2018). "تنفيذ التعلم الآلي في الرعاية الصحية - مواجهة التحديات الأخلاقية" . مجلة نيو انجلاند للطب . 378 (11): 981-983. دوى : 10.1056 / NEJMp1714229 . ISSN 0028-4793 . PMC 5962261 . بميد 29539284 .   
  117. ^ شار ، د. شاه ، نيو هامبشاير ؛ ماجنوس ، د. (2018). "تنفيذ التعلم الآلي في الرعاية الصحية - مواجهة التحديات الأخلاقية" . مجلة نيو انجلاند للطب . 378 (11): 981-983. دوى : 10.1056 / nejmp1714229 . PMC 5962261 . بميد 29539284 .  
  118. ^ Research ، AI (23 أكتوبر 2015). "الشبكات العصبية العميقة للنمذجة الصوتية في التعرف على الكلام" . airesearch.com . تم الاسترجاع 23 أكتوبر 2015 .
  119. ^ "استمرار سيطرة وحدات معالجة الرسومات على سوق مسرع الذكاء الاصطناعي في الوقت الحالي" . أسبوع المعلومات . ديسمبر 2019 . تم الاسترجاع 11 يونيو 2020 .
  120. ^ راي ، تيرنان (2019). "الذكاء الاصطناعي يغير طبيعة الحوسبة بالكامل" . ZDNet . تم الاسترجاع 11 يونيو 2020 .
  121. ^ "الذكاء الاصطناعي والحساب" . أوبن إيه آي . 16 مايو 2018 . تم الاسترجاع 11 يونيو 2020 .
  122. ^ "الشبكات العصبية المادية لـ Cornell & NTT:" بديل جذري لتنفيذ الشبكات العصبية العميقة "التي تتيح تدريب الأنظمة الفيزيائية التعسفية | المزامنة" . 27 مايو 2021.
  123. ^ "Nano-spaghetti لحل استهلاك طاقة الشبكة العصبية" .

المصادر

قراءات إضافية

روابط خارجية