في التعبئة ، كل شجرة فرديةمستقلة عن بعضها البعضلأنها تعتبر مجموعة فرعية مختلفة من الميزات والعينات.
ما هو التعبئة في شجرة القرار؟
التعبئة (تجميع التمهيد) يستخدمعندما يكون هدفنا هو تقليل التباين في شجرة القرار. الفكرة هنا هي إنشاء عدة مجموعات فرعية من البيانات من عينة تدريب يتم اختيارها عشوائيًا مع الاستبدال. … يتم استخدام متوسط جميع التوقعات من مختلف الأشجار وهو أكثر قوة من شجرة قرار واحدة.
لماذا ينتج عن التعبئة أشجار مترابطة؟
تميل جميع أشجارنا المعبأة إلىإجراء نفس التخفيضات لأنها تشترك جميعًا في نفس الميزات. هذا يجعل كل هذه الأشجار تبدو متشابهة جدًا وبالتالي زيادة الارتباط. لحل ارتباط الشجرة ، نسمح لـ Random Forest باختيار M فقط بشكل عشوائي في إجراء الانقسام.
ما هو تعبئة الغابة العشوائية؟
التعبئة عبارة عن خوارزمية تجميع تناسب نماذج متعددة على مجموعات فرعية مختلفة من مجموعة بيانات التدريب ، ثم تجمع التنبؤات من جميع النماذج. Random Forest هي امتدادللتعبئة التي تحدد أيضًا بشكل عشوائي مجموعات فرعية من الميزات المستخدمة في كل عينة بيانات.
كيف يعمل التغليف في الغابة العشوائية؟
خوارزمية الغابة العشوائية هي في الواقعخوارزمية تعبئة: هنا أيضًا ، نرسم عينات تمهيد عشوائية من مجموعة التدريب الخاصة بك. ومع ذلك ، بالإضافة إلى عينات التمهيد ، نحن أيضًارسم مجموعات فرعية عشوائية من الميزات لتدريب الأشجار الفردية ؛ في التعبئة ، نقدم لكل شجرة مجموعة كاملة من الميزات.