day 8 - linear regression

day 8 - linear regression

السلام عليكم ورحمة الله... معاكم Kaito :)


مرحبا بيكم فالنهار الثامن ديال سلسلة 30 يوم من التعلم الآلي..


اليوم..


غندخلو فالصح


اليوما غنبداو نشوفو دوك الخوارزميات و models


شنو هوما وكيفاش كيخدمو..


وغنشوفو حتا فين نقدر نتعلم ليهم


كاينين بزااااف ديال المودلز فهاد العالم


machine-learning-algorithms.png (550×411)


ولكن حنايا غنشوفو اللي مهم ومشهور ويستحق تعرف عليه


وغادي نبداو ب regression models


وأول واحد هو Linear Regression Model


هو واحد النوع ديال خوارزميات التعلم الالي تحت اشراف و اللي كنديروها فحالات ديال مشاكل الانحدار (بحال داك المشكل اللي كان عندنا ديالثمن الديور)


وهو اسهل نوع صراحة هوا اللي كيبداو بيه الناس اللي يلاه داخلين فالضومين


الدور ديالو هو انه يتوقع ليك واحد العدد او القيمة مستمرة

(dependant variable)


بناء على واحد اولا بزاف ديال الميزات و القيم اللي غيعاونو فهاد التوقع


(سميناهم قبل features ونقدرو نسميوهم independant variables)


ايلا عندنا قيمة وحدة بغينا نتوقعو بيها النتيجة هادي كتسمى simple linear regression,


اما ايلا عندنا كثر من وحدة كنسميوه multiple linear regression


النموذج اللي كانفترضو انه مزيان للبيانات كايكون على شكل دالة تآلفية:


y = a * X + b


داك y هو dependant variable او التوقع ديالنا


و X هي independant variable اللي غنستعملو فهاد التوقع


و b (intecept) هي واحد constant اولا النقطة فين كيتلاقا خط الدالة مع الارتوب


و a (slope) كيتسما coefficient واللي كيحدد شحال واحد التغيير فالقيمة ديال feature يقدر يأثر على القيمة ديال dependant variable



ايلا شفتي هاد الماط كامل ومفهمتي والو.. متلفش!!


راه غير زدتو باش نوريك الشكل الحقيقي ديال هاد الخوارزمية


ايلا بغيتي تفهم كثر هاهو واحد الشرح مفصل وبالدارجة من أكاديمية الفهرية تفرجو فيه راه ناااااضي => تفرج هنا


المهم انعطيك مثال اوضح انشرح ليك بيه كيفاش خدام دكشي:


تخيل معايا نتا recruteur جا واحد الموظف باش يخدم فشركة جديدة،


ف interview سولتيه شحال بغيتي يكون الصالير،


وهو يقوليك:


انا عندي 5 سنين ونص ديال الخبرة


وفالشركة القديمة ديالي كنت كنتخلص 80 الف درهم


اذن كنضن الصالير ديالي معاكم خص يكون بين 85-90 الف درهم


نتا بان ليك دكشي فشكل..


متيقتيهش فالاول وقلتي ليه صافي سير حتا نعيطو عليك


هو معارفكش بلي نتا راه recruteur وفنفس الوقت data scientist


وبلي عندك ديجا داتاسيت على لي صالير اللي كاينين على حسب سنوات الخبرة


هنايا غنطبقو الانحدار الخطي



عندنا فالسطر التحتاني "سنوات الخبرة" ، والفوق فالجنب عندنا "الصالير"


ودوك النقط هما الداتا اللي عندنا،


كل نقطة كترمز للصالير وسنوات الخبرة ديال داك الصالير


كيبان لينا بلي constant هنايا هي 30k


هدشي كيعني بلي ملي كتبدا الخدمة من الاول بلا خبرة


يعني يلاه داخل لسوق الشغل اول مرة،


الصالير ديالك كيبدا ب 30k


دبا خوارزمية الانحدار الخطي كتحاول ترسم واحد الخط اللي غدي يحاولو يقيسو او يقربو لكاع دوك النقط،


كتسما “best-fit line"


فالاول كتبدا بخط عادي عشوائي وكتحاول تقلل المسافة بين داك الخط وكل نقطة ديال الداتا..


داك المسافة او الفرق كيتسما الخطأ error ..


الخوارزمية كتبقا كتجرب وترسم وتحسب ديك المسافة حتا تلقا احسن خط كيقرب ليهم كاملين..

0*0plB5_YzkViGnD3j.gif (1600×900)


نزوميو شوية على هاد الخط وناخدو نقطة عشوائية من الداتا


37_blog_image_2.png (866×485)image.png (247×305)


هنايا التحت بالاخضر كيبان ليك شنو المودل كيتوقع غيكون الصالير ديال داك الموظف، والنقطة الحمراء هي الصالير ديالو فالحقيقة..


هاديك المسافة بيناتهم هي الخطأ error


ايلا بغينا الخط ديالنا نكون مزيان ويكون المودل ديالنا ناضي،


خص المجموع ديال دوك المسافات او الاخطاء فگاع النقط اللي كاينين تما ، يكون صغير ما امكن..


هادا بالنسبة للمودل simple linear regression


بالنسبة ل multiple linear regression


راه نفس الحاجة تقريبا..


غير بلاصة ميكون عندنا feature واحد


كيكون عندنا بزاف..


مثلا الصالير فهاد الحالة غدي نتوقعوه ماشي غير بسنوات الخبرة..


ولكن بسنوات الخبرة,


وشحال من عام قرا داك خونا,


وعدد ساعات العمل…


38_blog_image_1.png (865×382)

ولكن بلاتي..


ايلا كان كيسحاب ليك غيخصك تحسب هدشي كامل باش تقاد المودل ديالك..


فراك غالط


فبايثون ما عليك غير توجد ال features o dependant variables ديالك


و تعيط على LinearRegression().fit(X, y)


واللي كتوفرها ليك واحد الاداة سميتها sklearn


وصافي..


المهم هادي كانت اطلالة بسيطة على Linear Regression


ايلا فهمتي المثال راه فهمتي كلشي


غدا غنشوفو الغوريتم اخر ان شاء الله..


نتلاقاو فايمايل اخر غدا!


كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..



— Kaito



ملاحظات:


  • مصادر:

    superdatascience

    fihriya academy


  • ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي

    دخل لهنا: https://ko-fi.com/callmekaito

    شكرا (:


rest-9a9e6b30329429d1385775297f1ac9d1-a5esznpy.jpg (1200×600)


السلام عليكم ورحمة الله... معاكم Kaito :)


مرحبا بيكم فالنهار الثامن ديال سلسلة 30 يوم من التعلم الآلي..


اليوم..


غندخلو فالصح


اليوما غنبداو نشوفو دوك الخوارزميات و models


شنو هوما وكيفاش كيخدمو..


وغنشوفو حتا فين نقدر نتعلم ليهم


كاينين بزااااف ديال المودلز فهاد العالم


machine-learning-algorithms.png (550×411)


ولكن حنايا غنشوفو اللي مهم ومشهور ويستحق تعرف عليه


وغادي نبداو ب regression models


وأول واحد هو Linear Regression Model


هو واحد النوع ديال خوارزميات التعلم الالي تحت اشراف و اللي كنديروها فحالات ديال مشاكل الانحدار (بحال داك المشكل اللي كان عندنا ديالثمن الديور)


وهو اسهل نوع صراحة هوا اللي كيبداو بيه الناس اللي يلاه داخلين فالضومين


الدور ديالو هو انه يتوقع ليك واحد العدد او القيمة مستمرة

(dependant variable)


بناء على واحد اولا بزاف ديال الميزات و القيم اللي غيعاونو فهاد التوقع


(سميناهم قبل features ونقدرو نسميوهم independant variables)


ايلا عندنا قيمة وحدة بغينا نتوقعو بيها النتيجة هادي كتسمى simple linear regression,


اما ايلا عندنا كثر من وحدة كنسميوه multiple linear regression


النموذج اللي كانفترضو انه مزيان للبيانات كايكون على شكل دالة تآلفية:


y = a * X + b


داك y هو dependant variable او التوقع ديالنا


و X هي independant variable اللي غنستعملو فهاد التوقع


و b (intecept) هي واحد constant اولا النقطة فين كيتلاقا خط الدالة مع الارتوب


و a (slope) كيتسما coefficient واللي كيحدد شحال واحد التغيير فالقيمة ديال feature يقدر يأثر على القيمة ديال dependant variable



ايلا شفتي هاد الماط كامل ومفهمتي والو.. متلفش!!


راه غير زدتو باش نوريك الشكل الحقيقي ديال هاد الخوارزمية


ايلا بغيتي تفهم كثر هاهو واحد الشرح مفصل وبالدارجة من أكاديمية الفهرية تفرجو فيه راه ناااااضي => تفرج هنا


المهم انعطيك مثال اوضح انشرح ليك بيه كيفاش خدام دكشي:


تخيل معايا نتا recruteur جا واحد الموظف باش يخدم فشركة جديدة،


ف interview سولتيه شحال بغيتي يكون الصالير،


وهو يقوليك:


انا عندي 5 سنين ونص ديال الخبرة


وفالشركة القديمة ديالي كنت كنتخلص 80 الف درهم


اذن كنضن الصالير ديالي معاكم خص يكون بين 85-90 الف درهم


نتا بان ليك دكشي فشكل..


متيقتيهش فالاول وقلتي ليه صافي سير حتا نعيطو عليك


هو معارفكش بلي نتا راه recruteur وفنفس الوقت data scientist


وبلي عندك ديجا داتاسيت على لي صالير اللي كاينين على حسب سنوات الخبرة


هنايا غنطبقو الانحدار الخطي



عندنا فالسطر التحتاني "سنوات الخبرة" ، والفوق فالجنب عندنا "الصالير"


ودوك النقط هما الداتا اللي عندنا،


كل نقطة كترمز للصالير وسنوات الخبرة ديال داك الصالير


كيبان لينا بلي constant هنايا هي 30k


هدشي كيعني بلي ملي كتبدا الخدمة من الاول بلا خبرة


يعني يلاه داخل لسوق الشغل اول مرة،


الصالير ديالك كيبدا ب 30k


دبا خوارزمية الانحدار الخطي كتحاول ترسم واحد الخط اللي غدي يحاولو يقيسو او يقربو لكاع دوك النقط،


كتسما “best-fit line"


فالاول كتبدا بخط عادي عشوائي وكتحاول تقلل المسافة بين داك الخط وكل نقطة ديال الداتا..


داك المسافة او الفرق كيتسما الخطأ error ..


الخوارزمية كتبقا كتجرب وترسم وتحسب ديك المسافة حتا تلقا احسن خط كيقرب ليهم كاملين..

0*0plB5_YzkViGnD3j.gif (1600×900)


نزوميو شوية على هاد الخط وناخدو نقطة عشوائية من الداتا


37_blog_image_2.png (866×485)image.png (247×305)


هنايا التحت بالاخضر كيبان ليك شنو المودل كيتوقع غيكون الصالير ديال داك الموظف، والنقطة الحمراء هي الصالير ديالو فالحقيقة..


هاديك المسافة بيناتهم هي الخطأ error


ايلا بغينا الخط ديالنا نكون مزيان ويكون المودل ديالنا ناضي،


خص المجموع ديال دوك المسافات او الاخطاء فگاع النقط اللي كاينين تما ، يكون صغير ما امكن..


هادا بالنسبة للمودل simple linear regression


بالنسبة ل multiple linear regression


راه نفس الحاجة تقريبا..


غير بلاصة ميكون عندنا feature واحد


كيكون عندنا بزاف..


مثلا الصالير فهاد الحالة غدي نتوقعوه ماشي غير بسنوات الخبرة..


ولكن بسنوات الخبرة,


وشحال من عام قرا داك خونا,


وعدد ساعات العمل…


38_blog_image_1.png (865×382)

ولكن بلاتي..


ايلا كان كيسحاب ليك غيخصك تحسب هدشي كامل باش تقاد المودل ديالك..


فراك غالط


فبايثون ما عليك غير توجد ال features o dependant variables ديالك


و تعيط على LinearRegression().fit(X, y)


واللي كتوفرها ليك واحد الاداة سميتها sklearn


وصافي..


المهم هادي كانت اطلالة بسيطة على Linear Regression


ايلا فهمتي المثال راه فهمتي كلشي


غدا غنشوفو الغوريتم اخر ان شاء الله..


نتلاقاو فايمايل اخر غدا!


كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..



— Kaito



ملاحظات:


  • مصادر:

    superdatascience

    fihriya academy


  • ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي

    دخل لهنا: https://ko-fi.com/callmekaito

    شكرا (:


rest-9a9e6b30329429d1385775297f1ac9d1-a5esznpy.jpg (1200×600)