day 11 - K-Nearest Neighbors
(KNN)
day 11 - K-Nearest Neighbors
(KNN)
السلام عليكم ورحمة الله... معاكم Kaito :)
مرحبا بيكم فالنهار الحاضش (نهار 11) ديال سلسلة 30 يوم من التعلم الآلي..
البارح شفنا SVM
اليوم غنشوفو KNN
اللي هي اختصار لجملة K-Nearest Neighbors
او بالعربية الجار الأقرب من العدد 'k'

هو واحد النوع من خوارزميات التعلم الالي الخاضعة لاشراف
supervised machine learning algorithm
اللي كنخدمو بيها غالبا فمشاكل ديال classification
(قليل فاش كيخدمو بيها ف regression)
ايلا كنت غنشرحها فجملة ونسالي هنا
غدي نقول داك المثل اللي مكينش شي واحد مسمعوش..
"أرني اصدقائك وسأريك من أنت.."

هادا ببساطة هو KNN...
الهدف ديالو هو يصنف نقطة بيانات بناءً على أقرب نقاط البيانات "k" ليه ف ديك المساحة.

الخطوات ديال هاد algorithm كيكونو بحال هكا:
كتختار داك ال K , او عدد الجيران number of neighbors اللي نتا باغي تدير فهاد الحالة
كتقلب على k ديال نقط الجيران nearest neighbors
اللي هما اقرب نقط للنقطة الجديدة اللي بغيتي توقع الصنف ديالها
من بين دوك النقط k اللي ختاريتي,
كتحسب العدد ديال النقط من كل صنف.
كتحط النقطة الجديدة مع الصنف اللي فيه اكبر عدد من دوك النقط ديال nearest neighbors
نطبقو هاد الخطوات على واحد المثال:
عندنا graph فيه داتا ب 2 اصناف (مثلا تفاح بالاحمر وليمون بلخضر)
وبغينا نعرفو فاشمن صنف كاينة ديك النقطة الجديدة
الخطوة الاولى اللي قلنا هي ناخدو واحد العدد k
مثلا ناخدو 5
هاهوماك 5 دورنا عليهم..

الخطوة الثانية هي كنقلبو على اقرب نقط لديك لنقطة الجديدة
وباش كنعرفو شكون اللي قريب؟
كنحسبو المسافة بين النقطة الجديدة وكل نقطة من الداتا
وهاد المسافة كتسمى المسافة الاقليدية Euclidian Distance
(كاينين انواع من المسافات ماشي غير هادي.. ولكن هادي اشهرهم)

ما علينا المهم خص نلقاو اقرب 5 نقط ..
باش ندوزو للخطوة الثالثة
لي هي نحسبو شحال من نقطة كاينة فكل صنف من بين دوك ال5

هنايا كيبان ليا ف الصنف 1 (التفاح) فيه 3 ديال الجيران
والصنف 2 فيه غير 2 جيران
هنايا كندوزو للخطوة الرابعة
كنديرو الفوت vote وكنصوتو على الصنف اللي عندو الجيران اكثر
واللي هو بطبيعة الحال
الصنف 1
اذن المودل ديالنا KNN كيتوقع بلي النقطة الجديدة غتكون تفاح

هادا هو اللوجيك ديال KNN
شفتوها ساااهلة
كتدير نفس الحاجة اللي كتدير SVM اللي شفنا البارح..
غير كاينين شي اختلافات من ناحية التعقيد والاداء ديال المودل..
هاهو واحد المقال بالانجليزية كيتعمق كثر فالفرق بيناتهم
بلاتي؟
شفتك باغي تمشي بلا متسول على واحد الحاجة..
كيفاش كنختارو داك k ؟
مرة كندير 5 مرة كندير 3 .. واهدا عليا..
دبا البلان هو على حسب الداتا اللي عندك..
كنحاولو نختارو احسن عدد باش يعطينا نتيجة مزيانة
مكينش شي حل سحري اولا طريقة تطبقها تلقاها
وخا كاينين طرق كيدارو بحال cross validation, grid search
هدشي غنشوفوه من بعد ايلا ضرك راسك دبا نوض قلب عليه
ولكن اللي ينصح به هو انه العدد اللي كتختار خص يكون فردي
يعني 1, 3, 5, 7, 9, 11….
اضافة الى اشياء اخرى خص نردو ليها البال بحال bias - variance..
ولكن دكشي الى يوم اخر
هذي خلاصة اليوم..

نتلاقاو فايمايل اخر غدا!
كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..
— Kaito
ملاحظات:
ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي
دخل لهنا: https://ko-fi.com/callmekaito
شكرا (:

السلام عليكم ورحمة الله... معاكم Kaito :)
مرحبا بيكم فالنهار الحاضش (نهار 11) ديال سلسلة 30 يوم من التعلم الآلي..
البارح شفنا SVM
اليوم غنشوفو KNN
اللي هي اختصار لجملة K-Nearest Neighbors
او بالعربية الجار الأقرب من العدد 'k'

هو واحد النوع من خوارزميات التعلم الالي الخاضعة لاشراف
supervised machine learning algorithm
اللي كنخدمو بيها غالبا فمشاكل ديال classification
(قليل فاش كيخدمو بيها ف regression)
ايلا كنت غنشرحها فجملة ونسالي هنا
غدي نقول داك المثل اللي مكينش شي واحد مسمعوش..
"أرني اصدقائك وسأريك من أنت.."

هادا ببساطة هو KNN...
الهدف ديالو هو يصنف نقطة بيانات بناءً على أقرب نقاط البيانات "k" ليه ف ديك المساحة.

الخطوات ديال هاد algorithm كيكونو بحال هكا:
كتختار داك ال K , او عدد الجيران number of neighbors اللي نتا باغي تدير فهاد الحالة
كتقلب على k ديال نقط الجيران nearest neighbors
اللي هما اقرب نقط للنقطة الجديدة اللي بغيتي توقع الصنف ديالها
من بين دوك النقط k اللي ختاريتي,
كتحسب العدد ديال النقط من كل صنف.
كتحط النقطة الجديدة مع الصنف اللي فيه اكبر عدد من دوك النقط ديال nearest neighbors
نطبقو هاد الخطوات على واحد المثال:
عندنا graph فيه داتا ب 2 اصناف (مثلا تفاح بالاحمر وليمون بلخضر)
وبغينا نعرفو فاشمن صنف كاينة ديك النقطة الجديدة
الخطوة الاولى اللي قلنا هي ناخدو واحد العدد k
مثلا ناخدو 5
هاهوماك 5 دورنا عليهم..

الخطوة الثانية هي كنقلبو على اقرب نقط لديك لنقطة الجديدة
وباش كنعرفو شكون اللي قريب؟
كنحسبو المسافة بين النقطة الجديدة وكل نقطة من الداتا
وهاد المسافة كتسمى المسافة الاقليدية Euclidian Distance
(كاينين انواع من المسافات ماشي غير هادي.. ولكن هادي اشهرهم)

ما علينا المهم خص نلقاو اقرب 5 نقط ..
باش ندوزو للخطوة الثالثة
لي هي نحسبو شحال من نقطة كاينة فكل صنف من بين دوك ال5

هنايا كيبان ليا ف الصنف 1 (التفاح) فيه 3 ديال الجيران
والصنف 2 فيه غير 2 جيران
هنايا كندوزو للخطوة الرابعة
كنديرو الفوت vote وكنصوتو على الصنف اللي عندو الجيران اكثر
واللي هو بطبيعة الحال
الصنف 1
اذن المودل ديالنا KNN كيتوقع بلي النقطة الجديدة غتكون تفاح

هادا هو اللوجيك ديال KNN
شفتوها ساااهلة
كتدير نفس الحاجة اللي كتدير SVM اللي شفنا البارح..
غير كاينين شي اختلافات من ناحية التعقيد والاداء ديال المودل..
هاهو واحد المقال بالانجليزية كيتعمق كثر فالفرق بيناتهم
بلاتي؟
شفتك باغي تمشي بلا متسول على واحد الحاجة..
كيفاش كنختارو داك k ؟
مرة كندير 5 مرة كندير 3 .. واهدا عليا..
دبا البلان هو على حسب الداتا اللي عندك..
كنحاولو نختارو احسن عدد باش يعطينا نتيجة مزيانة
مكينش شي حل سحري اولا طريقة تطبقها تلقاها
وخا كاينين طرق كيدارو بحال cross validation, grid search
هدشي غنشوفوه من بعد ايلا ضرك راسك دبا نوض قلب عليه
ولكن اللي ينصح به هو انه العدد اللي كتختار خص يكون فردي
يعني 1, 3, 5, 7, 9, 11….
اضافة الى اشياء اخرى خص نردو ليها البال بحال bias - variance..
ولكن دكشي الى يوم اخر
هذي خلاصة اليوم..

نتلاقاو فايمايل اخر غدا!
كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..
— Kaito
ملاحظات:
ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي
دخل لهنا: https://ko-fi.com/callmekaito
شكرا (:

التالي