day 11 - K-Nearest Neighbors
(KNN)

day 11 - K-Nearest Neighbors
(KNN)

السلام عليكم ورحمة الله... معاكم Kaito :)


مرحبا بيكم فالنهار الحاضش (نهار 11) ديال سلسلة 30 يوم من التعلم الآلي..


البارح شفنا SVM


اليوم غنشوفو KNN


اللي هي اختصار لجملة K-Nearest Neighbors


او بالعربية الجار الأقرب من العدد 'k'



هو واحد النوع من خوارزميات التعلم الالي الخاضعة لاشراف

supervised machine learning algorithm


اللي كنخدمو بيها غالبا فمشاكل ديال classification


(قليل فاش كيخدمو بيها ف regression)


ايلا كنت غنشرحها فجملة ونسالي هنا


غدي نقول داك المثل اللي مكينش شي واحد مسمعوش..


"أرني اصدقائك وسأريك من أنت.."



هادا ببساطة هو KNN...


الهدف ديالو هو يصنف نقطة بيانات بناءً على أقرب نقاط البيانات "k" ليه ف ديك المساحة.



image.png (1920×803)


الخطوات ديال هاد algorithm كيكونو بحال هكا:


  1. كتختار داك ال K , او عدد الجيران number of neighbors اللي نتا باغي تدير فهاد الحالة



  2. كتقلب على k ديال نقط الجيران nearest neighbors


    اللي هما اقرب نقط للنقطة الجديدة اللي بغيتي توقع الصنف ديالها



  1. من بين دوك النقط k اللي ختاريتي,


    كتحسب العدد ديال النقط من كل صنف.



  1. كتحط النقطة الجديدة مع الصنف اللي فيه اكبر عدد من دوك النقط ديال nearest neighbors


نطبقو هاد الخطوات على واحد المثال:


عندنا graph فيه داتا ب 2 اصناف (مثلا تفاح بالاحمر وليمون بلخضر)


وبغينا نعرفو فاشمن صنف كاينة ديك النقطة الجديدة


الخطوة الاولى اللي قلنا هي ناخدو واحد العدد k


مثلا ناخدو 5


هاهوماك 5 دورنا عليهم..


0e0283b0ccd997b34b3f6517f1b82ae48459f18d.png (757×474)


الخطوة الثانية هي كنقلبو على اقرب نقط لديك لنقطة الجديدة


وباش كنعرفو شكون اللي قريب؟


كنحسبو المسافة بين النقطة الجديدة وكل نقطة من الداتا


وهاد المسافة كتسمى المسافة الاقليدية Euclidian Distance


(كاينين انواع من المسافات ماشي غير هادي.. ولكن هادي اشهرهم)


k-nearest-neighbor-algorithm-for-machine-learning4.png (500×400)


ما علينا المهم خص نلقاو اقرب 5 نقط ..


باش ندوزو للخطوة الثالثة


لي هي نحسبو شحال من نقطة كاينة فكل صنف من بين دوك ال5


102deb99f2b07c07bd93a1c394e80c7997fbac8a.png (858×416)



هنايا كيبان ليا ف الصنف 1 (التفاح) فيه 3 ديال الجيران


والصنف 2 فيه غير 2 جيران


هنايا كندوزو للخطوة الرابعة


كنديرو الفوت vote وكنصوتو على الصنف اللي عندو الجيران اكثر


واللي هو بطبيعة الحال


الصنف 1


اذن المودل ديالنا KNN كيتوقع بلي النقطة الجديدة غتكون تفاح


bb0e738073edafda1d447e63ff71ddf7103d598f.png (858×422)



هادا هو اللوجيك ديال KNN


شفتوها ساااهلة


كتدير نفس الحاجة اللي كتدير SVM اللي شفنا البارح..


غير كاينين شي اختلافات من ناحية التعقيد والاداء ديال المودل..


هاهو واحد المقال بالانجليزية كيتعمق كثر فالفرق بيناتهم



بلاتي؟


شفتك باغي تمشي بلا متسول على واحد الحاجة..


كيفاش كنختارو داك k ؟


مرة كندير 5 مرة كندير 3 .. واهدا عليا..


دبا البلان هو على حسب الداتا اللي عندك..


كنحاولو نختارو احسن عدد باش يعطينا نتيجة مزيانة


مكينش شي حل سحري اولا طريقة تطبقها تلقاها


وخا كاينين طرق كيدارو بحال cross validation, grid search


هدشي غنشوفوه من بعد ايلا ضرك راسك دبا نوض قلب عليه


ولكن اللي ينصح به هو انه العدد اللي كتختار خص يكون فردي


يعني 1, 3, 5, 7, 9, 11….


اضافة الى اشياء اخرى خص نردو ليها البال بحال bias - variance..


ولكن دكشي الى يوم اخر


هذي خلاصة اليوم..



0*elaSSkBa3Gi9H1-x.png (591×515)


نتلاقاو فايمايل اخر غدا!


كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..



— Kaito



ملاحظات:



  • ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي

    دخل لهنا: https://ko-fi.com/callmekaito

    شكرا (:


rest-9a9e6b30329429d1385775297f1ac9d1-a5esznpy.jpg (1200×600)


السلام عليكم ورحمة الله... معاكم Kaito :)


مرحبا بيكم فالنهار الحاضش (نهار 11) ديال سلسلة 30 يوم من التعلم الآلي..


البارح شفنا SVM


اليوم غنشوفو KNN


اللي هي اختصار لجملة K-Nearest Neighbors


او بالعربية الجار الأقرب من العدد 'k'



هو واحد النوع من خوارزميات التعلم الالي الخاضعة لاشراف

supervised machine learning algorithm


اللي كنخدمو بيها غالبا فمشاكل ديال classification


(قليل فاش كيخدمو بيها ف regression)


ايلا كنت غنشرحها فجملة ونسالي هنا


غدي نقول داك المثل اللي مكينش شي واحد مسمعوش..


"أرني اصدقائك وسأريك من أنت.."



هادا ببساطة هو KNN...


الهدف ديالو هو يصنف نقطة بيانات بناءً على أقرب نقاط البيانات "k" ليه ف ديك المساحة.



image.png (1920×803)


الخطوات ديال هاد algorithm كيكونو بحال هكا:


  1. كتختار داك ال K , او عدد الجيران number of neighbors اللي نتا باغي تدير فهاد الحالة



  2. كتقلب على k ديال نقط الجيران nearest neighbors


    اللي هما اقرب نقط للنقطة الجديدة اللي بغيتي توقع الصنف ديالها



  1. من بين دوك النقط k اللي ختاريتي,


    كتحسب العدد ديال النقط من كل صنف.



  1. كتحط النقطة الجديدة مع الصنف اللي فيه اكبر عدد من دوك النقط ديال nearest neighbors


نطبقو هاد الخطوات على واحد المثال:


عندنا graph فيه داتا ب 2 اصناف (مثلا تفاح بالاحمر وليمون بلخضر)


وبغينا نعرفو فاشمن صنف كاينة ديك النقطة الجديدة


الخطوة الاولى اللي قلنا هي ناخدو واحد العدد k


مثلا ناخدو 5


هاهوماك 5 دورنا عليهم..


0e0283b0ccd997b34b3f6517f1b82ae48459f18d.png (757×474)


الخطوة الثانية هي كنقلبو على اقرب نقط لديك لنقطة الجديدة


وباش كنعرفو شكون اللي قريب؟


كنحسبو المسافة بين النقطة الجديدة وكل نقطة من الداتا


وهاد المسافة كتسمى المسافة الاقليدية Euclidian Distance


(كاينين انواع من المسافات ماشي غير هادي.. ولكن هادي اشهرهم)


k-nearest-neighbor-algorithm-for-machine-learning4.png (500×400)


ما علينا المهم خص نلقاو اقرب 5 نقط ..


باش ندوزو للخطوة الثالثة


لي هي نحسبو شحال من نقطة كاينة فكل صنف من بين دوك ال5


102deb99f2b07c07bd93a1c394e80c7997fbac8a.png (858×416)



هنايا كيبان ليا ف الصنف 1 (التفاح) فيه 3 ديال الجيران


والصنف 2 فيه غير 2 جيران


هنايا كندوزو للخطوة الرابعة


كنديرو الفوت vote وكنصوتو على الصنف اللي عندو الجيران اكثر


واللي هو بطبيعة الحال


الصنف 1


اذن المودل ديالنا KNN كيتوقع بلي النقطة الجديدة غتكون تفاح


bb0e738073edafda1d447e63ff71ddf7103d598f.png (858×422)



هادا هو اللوجيك ديال KNN


شفتوها ساااهلة


كتدير نفس الحاجة اللي كتدير SVM اللي شفنا البارح..


غير كاينين شي اختلافات من ناحية التعقيد والاداء ديال المودل..


هاهو واحد المقال بالانجليزية كيتعمق كثر فالفرق بيناتهم



بلاتي؟


شفتك باغي تمشي بلا متسول على واحد الحاجة..


كيفاش كنختارو داك k ؟


مرة كندير 5 مرة كندير 3 .. واهدا عليا..


دبا البلان هو على حسب الداتا اللي عندك..


كنحاولو نختارو احسن عدد باش يعطينا نتيجة مزيانة


مكينش شي حل سحري اولا طريقة تطبقها تلقاها


وخا كاينين طرق كيدارو بحال cross validation, grid search


هدشي غنشوفوه من بعد ايلا ضرك راسك دبا نوض قلب عليه


ولكن اللي ينصح به هو انه العدد اللي كتختار خص يكون فردي


يعني 1, 3, 5, 7, 9, 11….


اضافة الى اشياء اخرى خص نردو ليها البال بحال bias - variance..


ولكن دكشي الى يوم اخر


هذي خلاصة اليوم..



0*elaSSkBa3Gi9H1-x.png (591×515)


نتلاقاو فايمايل اخر غدا!


كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..



— Kaito



ملاحظات:



  • ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي

    دخل لهنا: https://ko-fi.com/callmekaito

    شكرا (:


rest-9a9e6b30329429d1385775297f1ac9d1-a5esznpy.jpg (1200×600)


التالي