day 13 - Q&A session (again)

السلام عليكم ورحمة الله... معاكم Kaito :)


مرحبا بيكم فالنهار 13 ديال سلسلة 30 يوم من التعلم الآلي..


هاد اليامات شفنا بزاف ديال algorithms


وشفنا كيفاش كيخدمو


اليوم غنديرو عوتاني واحد pause


باش نجاوب على الاسئلة اللي جاوني فالمايل وحتى فالانستا


واللي حتا نتوما غتكونو سولتو راسكم قبل


giphy_bf889ecebf.gif (640×360)


س1:


انا عاد تسجلت وموصلونيش الايمايلات القدام فين نلقاهم؟


ج:


هاد السؤال ديجا جاوبت عليه شحال من مرة


غتلقا الايمايلات كاملين فهاد الليان هنايا => Link



س2:


ايمتا الريلز الله يرحم الوالدين؟


ج:


راني بديت كنصور فيهم و راه غيتلاحو ان شاء الله


مع نساليو هاد الحريرة ديال الكتابة


حيت راه كل نهار كنكتب.. يلاه لقيت هاد الايام شي اوقات باش نصور


لذلك وجدو لأحسن كونتنت غتشوفو فانستا وتيكتوك ان شاء الله



س3:


بالنسبة ل outliers إذا لقيناهم واش كنمسحوهم نهائيا من dataset ديالنا؟ 


ج:


ماشي ديما


حذف الoutliers او الحالات الشاذة من الداتاسيت ديالك كيبقا حل


ولمن ديما على حسب السياق و طبيعة ديال الداتا ديالك


ايلا كنتي متأكدة بلي هاد outliers هما عبارة على خطأ فالادخال


او خطا فالحساب


اولا لا علاقة ليهم بالداتا ديالك گاع..


مسحيه


ولكن خص تردي البال حيت تقدر تكون ديك الداتا مهمة وعندها قيمة بصح،


مثلا ايلا بان ليك outliers عندهم علاقة مع feature تقدري تمسحي دكشي ويمشي ليك pattern مهم كنتي غتستعمليه


كاين حل اخر..


تقدري بلاصة متمسحيه تحوليه ل mean اولا median اولا mode ديال الداتا


هاد اللعيبة كتسمى imputation


عوتاني تقدر تدير واحد البلان سميتو capping


وهو انه ايلا عندك outliers اللي القيمة ديالهم كبيرة بزاف


مثلا الداتا العادية عندك قيم ما بين 0 و 100


و دوك outliers عندك فيهم 1000 او 10000


كترجعهم مثلا ل 100


ميفوتوش داك المجال الاقصى


وكاينين طرق اخرى رياضية باش تعامل مع ال outliers


ولكن كتبقى اهم حاجة


هي تفهم علاش عندك بعدا outliers فالداتا ديالك


عاد تشوف كيفاش تعامل معاهم


حيث بعض المرات يقدو يكونو مهميين ومفيدين


وكيعطيوك معلومات غتعاونك فالدراسة ديال الداتا ديالك..


Feature-engineering--The-Art-of-Feature-Engineering-in-Predictive-Modeling--Dealing-with-Outliers.webp (1350×759)


س4:


مفهمتش واحد القضية..


دبا نورمالمون حنا كنختارو فلول واش نخدمو ب linear regression اولا ب logistic regression,


و انا على حساب شنو فهمت الاختيار غيكون على حساب الداتا (واش عندها اه/لا يعني الاصناف، اولا بزاف ديال المتغيرات variables ).


واش مكانش يمكن نخدمو غير ب linear regression بحال ايلا ديك اه لا نعتابروهوم غير متغيرين مختلفين؟


ج:


عندك الحق ملي قلتي بلي الاختيار ديال اللي غديري كيكون على حساب الداتا اللي عندك


ف كنا درنا مثال ديال توقع ثمن الديور


الثمن هو عبارة على واحد القيمة مستمرة


يعني كتبدل من 0 حتال مالانهاية


ف عندنا متغيرات مصنفة Categorical Variable


وهوما قيم ماشي مستمرة ولكن ثابتة ( عندي 1 - 0 يعني نعم او لا)


هاد النوع كيتسمى binary classification


او كيصلاح ليهم logistic regression بزاف


نقدو نطبقو linear regression هنايا


ولكن غادي يصدقو عندنا شي توقعات كبر من 1 وصغر من 0


وهوما دوك السطورا اللي كانو خارجين فداك الخط لي كاين هنايا



ايلا كنتي مزال عاقل


اذن غنطبقو logistic regression فهاد البلان


ولكن اكرر.. كلشي على الداتا


وراه شفنا غير بعينينا داك النهار بلي ميمكنش تكون linear


حيت داك الخط ماغاديش يقد يوصل ل دوك النقط كاملين


هادا هو البلان


الايمايل ديال اليوم كان قصير..


هدشي اللي عطا الله


اللي عندو شي سؤال مراحب والله.. راه كنجاوب العالم كامل فالمايل


مبقا قد ما فات..


قريب ندويو على ChatGPT


وقريب تشوفو العجب فهاد العالم الهربان..


نتلاقاو فايمايل اخر غدا!


كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..



— Kaito



ملاحظات:



  • ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي

    دخل لهنا: https://ko-fi.com/callmekaito

    شكرا (:


rest-9a9e6b30329429d1385775297f1ac9d1-a5esznpy.jpg (1200×600)


السلام عليكم ورحمة الله... معاكم Kaito :)


مرحبا بيكم فالنهار 13 ديال سلسلة 30 يوم من التعلم الآلي..


هاد اليامات شفنا بزاف ديال algorithms


وشفنا كيفاش كيخدمو


اليوم غنديرو عوتاني واحد pause


باش نجاوب على الاسئلة اللي جاوني فالمايل وحتى فالانستا


واللي حتا نتوما غتكونو سولتو راسكم قبل


giphy_bf889ecebf.gif (640×360)


س1:


انا عاد تسجلت وموصلونيش الايمايلات القدام فين نلقاهم؟


ج:


هاد السؤال ديجا جاوبت عليه شحال من مرة


غتلقا الايمايلات كاملين فهاد الليان هنايا => Link



س2:


ايمتا الريلز الله يرحم الوالدين؟


ج:


راني بديت كنصور فيهم و راه غيتلاحو ان شاء الله


مع نساليو هاد الحريرة ديال الكتابة


حيت راه كل نهار كنكتب.. يلاه لقيت هاد الايام شي اوقات باش نصور


لذلك وجدو لأحسن كونتنت غتشوفو فانستا وتيكتوك ان شاء الله



س3:


بالنسبة ل outliers إذا لقيناهم واش كنمسحوهم نهائيا من dataset ديالنا؟ 


ج:


ماشي ديما


حذف الoutliers او الحالات الشاذة من الداتاسيت ديالك كيبقا حل


ولمن ديما على حسب السياق و طبيعة ديال الداتا ديالك


ايلا كنتي متأكدة بلي هاد outliers هما عبارة على خطأ فالادخال


او خطا فالحساب


اولا لا علاقة ليهم بالداتا ديالك گاع..


مسحيه


ولكن خص تردي البال حيت تقدر تكون ديك الداتا مهمة وعندها قيمة بصح،


مثلا ايلا بان ليك outliers عندهم علاقة مع feature تقدري تمسحي دكشي ويمشي ليك pattern مهم كنتي غتستعمليه


كاين حل اخر..


تقدري بلاصة متمسحيه تحوليه ل mean اولا median اولا mode ديال الداتا


هاد اللعيبة كتسمى imputation


عوتاني تقدر تدير واحد البلان سميتو capping


وهو انه ايلا عندك outliers اللي القيمة ديالهم كبيرة بزاف


مثلا الداتا العادية عندك قيم ما بين 0 و 100


و دوك outliers عندك فيهم 1000 او 10000


كترجعهم مثلا ل 100


ميفوتوش داك المجال الاقصى


وكاينين طرق اخرى رياضية باش تعامل مع ال outliers


ولكن كتبقى اهم حاجة


هي تفهم علاش عندك بعدا outliers فالداتا ديالك


عاد تشوف كيفاش تعامل معاهم


حيث بعض المرات يقدو يكونو مهميين ومفيدين


وكيعطيوك معلومات غتعاونك فالدراسة ديال الداتا ديالك..


Feature-engineering--The-Art-of-Feature-Engineering-in-Predictive-Modeling--Dealing-with-Outliers.webp (1350×759)


س4:


مفهمتش واحد القضية..


دبا نورمالمون حنا كنختارو فلول واش نخدمو ب linear regression اولا ب logistic regression,


و انا على حساب شنو فهمت الاختيار غيكون على حساب الداتا (واش عندها اه/لا يعني الاصناف، اولا بزاف ديال المتغيرات variables ).


واش مكانش يمكن نخدمو غير ب linear regression بحال ايلا ديك اه لا نعتابروهوم غير متغيرين مختلفين؟


ج:


عندك الحق ملي قلتي بلي الاختيار ديال اللي غديري كيكون على حساب الداتا اللي عندك


ف كنا درنا مثال ديال توقع ثمن الديور


الثمن هو عبارة على واحد القيمة مستمرة


يعني كتبدل من 0 حتال مالانهاية


ف عندنا متغيرات مصنفة Categorical Variable


وهوما قيم ماشي مستمرة ولكن ثابتة ( عندي 1 - 0 يعني نعم او لا)


هاد النوع كيتسمى binary classification


او كيصلاح ليهم logistic regression بزاف


نقدو نطبقو linear regression هنايا


ولكن غادي يصدقو عندنا شي توقعات كبر من 1 وصغر من 0


وهوما دوك السطورا اللي كانو خارجين فداك الخط لي كاين هنايا



ايلا كنتي مزال عاقل


اذن غنطبقو logistic regression فهاد البلان


ولكن اكرر.. كلشي على الداتا


وراه شفنا غير بعينينا داك النهار بلي ميمكنش تكون linear


حيت داك الخط ماغاديش يقد يوصل ل دوك النقط كاملين


هادا هو البلان


الايمايل ديال اليوم كان قصير..


هدشي اللي عطا الله


اللي عندو شي سؤال مراحب والله.. راه كنجاوب العالم كامل فالمايل


مبقا قد ما فات..


قريب ندويو على ChatGPT


وقريب تشوفو العجب فهاد العالم الهربان..


نتلاقاو فايمايل اخر غدا!


كنتمنى تكونو استافدتو.. ايلا عندكم شي تساؤل اولا مشرحتش شي حاجة مزيان، غير صيفط ليا رد فهاد المايل نيت..



— Kaito



ملاحظات:



  • ايلا عاجبك هدشي وقادر باش تساند هاد newsletter بدعم مادي

    دخل لهنا: https://ko-fi.com/callmekaito

    شكرا (:


rest-9a9e6b30329429d1385775297f1ac9d1-a5esznpy.jpg (1200×600)


التالي