، تهران , (اخبار رسمی): نقش ریاضیات در یادگیری ماشینی
اتوماسیون و یادگیری ماشین زندگی ما را تغییر داده است. از باهوشترین افراد از نظر فناوری که در شرکتهای پیشرو پلتفرمهای دیجیتالی مانند گوگل یا فیسبوک کار میکنند تا افرادی که فقط یک کاربر گوشیهای هوشمند هستند، تعداد بسیار کمی هستند که تحت تأثیر هوش مصنوعی یا یادگیری ماشینی قرار نگرفته باشند. از طریق رسانه های اجتماعی، بانکداری هوشمند، مراقبت های بهداشتی یا حتی اوبر. قلبل از ادامه مقاله از شما دعوت می کنیم جهت آموزش ریاضی هفتم به سایت 20شو مراجعه کنید.
از اتومبیل های خودران، ربات ها، تشخیص تصویر، ارزیابی های تشخیصی، موتورهای توصیه، برچسب گذاری عکس، تشخیص تقلب و موارد دیگر، آینده برای یادگیری ماشینی و هوش مصنوعی روشن و پر از امکانات استفاده نشده است.
با نوید بسیاری از نوآوریها و ایدههای راهگشا، هر فردی که از راه دور به فناوری آیندهنگر علاقه دارد، ممکن است آرزوی حرفهای در یادگیری ماشین را داشته باشد. اما چگونه میتوانید به عنوان یک مبتدی، در مورد آخرین فناوریها و زمینههای متنوعی که به آن کمک میکنند، بیاموزید؟ ممکن است در مورد پروفایل های شغلی بسیار جالبی مانند دانشمند داده، تحلیلگر داده، مهندس داده، مهندس یادگیری ماشین و غیره شنیده باشید که نه تنها از نظر پولی پاداش می دهند بلکه به فرد اجازه می دهند به عنوان یک توسعه دهنده و خالق رشد کند و در برخی از بهترین ها کار کند. شرکت های فناوری پربار عصر ما. اما اگر می خواهید حرفه ای را در یادگیری ماشین شروع کنید، چگونه می توانید شروع کنید؟ چه پیشینه تحصیلی را باید دنبال کنید و چه مهارت هایی را باید یاد بگیرید؟ یادگیری ماشین زمینه ای است که احتمال، آمار، علوم کامپیوتر و الگوریتم هایی را در بر می گیرد که برای ایجاد برنامه های کاربردی هوشمند استفاده می شود. این برنامه ها قابلیت جمع آوری اطلاعات مفید و روشنگری را از داده هایی دارند که برای دستیابی به بینش های تجاری مفید است. از آنجایی که یادگیری ماشین تماماً در مورد مطالعه و استفاده از الگوریتم ها است، مهم است که شما در ریاضیات پایه داشته باشید.
چرا باید ریاضی یاد بگیرم؟
ریاضی چیست؟ ریاضی به بخشی از زندگی روزمره ما تبدیل شده است. از زمانی که از خواب بیدار می شویم تا زمانی که به رختخواب می رویم، از ریاضیات در تمام جنبه های زندگی خود استفاده می کنیم. اما ممکن است در مورد اهمیت ریاضیات در یادگیری ماشینی و اینکه آیا و چگونه می توان از آن برای حل مشکلات تجاری در دنیای واقعی استفاده کرد تعجب کنید.
هدف شما هرچه که باشد، چه دانشمند داده، چه تحلیلگر داده یا مهندس یادگیری ماشین باشد، حوزه اصلی تمرکز شما باید روی «ریاضیات» باشد. ریاضی بلوک اصلی برای حل همه برنامههای کاربردی تجاری و داده محور در سناریوی دنیای واقعی است. از تجزیه و تحلیل معاملات شرکت تا درک چگونگی رشد در بازار روزانه، پیشبینی سهام آینده شرکت تا پیشبینی فروش آتی، ریاضی تقریباً در هر زمینهای از تجارت استفاده میشود. کاربردهای ریاضی در بسیاری از صنایع مانند خردهفروشی، تولید، فناوری اطلاعات استفاده میشود تا نمای کلی شرکت را از نظر فروش، تولید، دریافت کالا، دستمزد پرداختی، پیشبینی سطح آنها در بازار کنونی و موارد دیگر نشان دهد.
ارکان یادگیری ماشینی
برای شروع اولیه و آشنایی با جدیدترین فناوریها مانند یادگیری ماشین، علم داده و هوش مصنوعی، باید مفاهیم پایه ریاضی را درک کنیم، الگوریتمهای خود را بنویسیم و الگوریتمهای موجود را برای حل بسیاری از مسائل دنیای واقعی پیادهسازی کنیم.
چهار رکن یادگیری ماشینی وجود دارد که اکثر مشکلات کسب و کار دنیای واقعی ما در آنها حل می شود. بسیاری از الگوریتم ها در یادگیری ماشین نیز با استفاده از این ستون ها نوشته شده اند. آن ها هستند
- آمار
- احتمال
- حساب دیفرانسیل و انتگرال
- جبر خطی
یادگیری ماشینی همه چیز در مورد برخورد با داده ها است. ما دادهها را از سازمانها یا از هر مخازنی مانند Kaggle، UCI و غیره جمعآوری میکنیم و عملیات مختلفی را روی مجموعه دادهها مانند تمیز کردن و پردازش دادهها، تجسم و پیشبینی خروجی دادهها انجام میدهیم. برای تمام عملیاتهایی که روی دادهها انجام میدهیم، یک پایه مشترک وجود دارد که به ما کمک میکند به همه اینها از طریق محاسبات دست یابیم - و آن ریاضی است.
پیشنهاد مطالعه: چگونه مهارت های ریاضی کودک خود را تقویت کنیم
آمار
در نتیجه گیری از داده ها استفاده می شود. به روش های آماری جمع آوری، ارائه، تجزیه و تحلیل و تفسیر داده های عددی می پردازد. آمار نقش مهمی در زمینه یادگیری ماشین ایفا می کند زیرا با حجم زیادی از داده ها سر و کار دارد و عامل اصلی رشد و توسعه یک سازمان است.
- جمع آوری داده ها از سرشماری، نمونه ها، منابع داده اولیه یا ثانویه و موارد دیگر امکان پذیر است. این مرحله به ما کمک می کند تا اهداف خود را شناسایی کنیم تا روی مراحل بعدی کار کنیم.
- دادههایی که جمعآوری میشوند حاوی نویز، دادههای نامناسب، مقادیر صفر، نقاط پرت و غیره هستند.
- داده ها باید به شیوه ای مناسب و مختصر ارائه شوند. این یکی از مهم ترین مراحل است زیرا به درک بینش ها کمک می کند و به عنوان پایه ای برای تجزیه و تحلیل بیشتر داده ها استفاده می شود.
- تجزیه و تحلیل داده ها شامل تراکم، خلاصه سازی، نتیجه گیری و غیره از طریق روش های گرایش مرکزی، پراکندگی، چولگی، کرتوزیس، همبستگی، رگرسیون و سایر روش ها می باشد.
- مرحله تفسیر شامل نتیجهگیری از دادههای جمعآوریشده است، زیرا ارقام به خودی خود صحبت نمیکنند.
آمارهای مورد استفاده در یادگیری ماشینی بر اساس نوع تجزیه و تحلیلی که روی داده ها انجام می دهند، به طور کلی به دو دسته تقسیم می شوند. آنها آمار توصیفی و آمار استنباطی هستند.
الف) آمار توصیفی
- دغدغه توصیف و جمع بندی جامعه هدف
- روی یک مجموعه داده کوچک کار می کند.
- نتایج نهایی در قالب نمایش های تصویری نشان داده شده است.
- ابزارهای مورد استفاده در آمار توصیفی عبارتند از - میانگین، میانه، حالت که معیارهای مرکزی و محدوده، انحراف استاندارد، واریانس و غیره هستند که معیارهای متغیر بودن هستند.
ب) آمار استنباطی
- روش های تصمیم گیری یا پیش بینی در مورد یک جمعیت بر اساس اطلاعات نمونه.
- روی یک مجموعه داده بزرگ کار می کند.
- مقایسه، آزمایش و پیش بینی نتایج آینده.
- نتایج نهایی در امتیازات احتمال نشان داده شده است.
- ویژگی آمار استنباطی این است که فراتر از داده های موجود، درباره جمعیت نتیجه گیری می کند.
- آزمون فرضیه، توزیع نمونه گیری، تحلیل واریانس (ANOVA) و غیره ابزارهای مورد استفاده در آمار استنباطی هستند.
آمار نقش مهمی در الگوریتم های یادگیری ماشین ایفا می کند. نقش یک تحلیلگر داده در صنعت نتیجه گیری از داده ها است و برای این کار نیاز به آمار دارد و به آن وابسته است.
احتمال
کلمه احتمال به معنی وقوع یک رویداد خاص و احتمال وقوع آن رویداد بر اساس تجربیات قدیمی است. در زمینه یادگیری ماشینی، در پیش بینی احتمال رویدادهای آینده استفاده می شود.
P(رویداد) = نتایج مطلوب / تعداد کل نتایج ممکن
در زمینه احتمال، یک رویداد مجموعه ای از نتایج یک آزمایش است. P(E) نشان دهنده احتمال وقوع یک رویداد است و E یک رویداد نامیده می شود. احتمال وقوع هر رویدادی بین 0 تا 1 است. موقعیتی که در آن رویداد E ممکن است رخ دهد یا نه، دنباله نامیده می شود.
برخی از مفاهیم اساسی مورد نیاز در احتمال به شرح زیر است
- احتمال مشترک: P(A ∩ B) = P(A). P(B)، این نوع احتمال تنها زمانی امکان پذیر است که رویدادهای A و B مستقل از یکدیگر باشند.
- احتمال شرطی: احتمال وقوع رویداد A است، زمانی که معلوم شود که رویداد دیگری B قبلاً اتفاق افتاده است و با P (A|B) نشان داده می شود.
یعنی P(A|B) = P(A ∩ B)/ P(B)
- قضیه بیز: به کاربردهای نتایج نظریه احتمال که شامل تخمین احتمالات مجهول و تصمیم گیری بر اساس اطلاعات نمونه جدید می باشد، اطلاق می شود. در حل مشکلات تجاری در صورت وجود اطلاعات اضافی مفید است. دلیل محبوبیت این قضیه به دلیل مفید بودن آن در بازنگری مجموعهای از احتمالات قدیمی (احتمال قبلی) با اطلاعات اضافی و استخراج مجموعهای از احتمالات جدید (احتمال پسین) است.
احتمال وقوع یک رویداد به صورت محاسبه می شود
از معادله فوق چنین استنباط می شود که "قضیه بیز رابطه بین احتمالات شرطی رویدادها را توضیح می دهد." این قضیه عمدتاً روی نمونههای عدم قطعیت دادهها کار میکند و در تعیین «ویژگی» و «حساسیت» دادهها مفید است. این قضیه نقش مهمی در ترسیم ماتریس سردرگمی دارد.
ماتریس سردرگمی یک ساختار جدول مانند است که عملکرد مدلهای یادگیری ماشین یا الگوریتمهایی را که توسعه میدهیم اندازهگیری میکند. این برای تعیین نرخ های مثبت واقعی، نرخ های منفی واقعی، نرخ های مثبت کاذب، نرخ های منفی کاذب، دقت، یادآوری، امتیاز F1، دقت و ویژگی در رسم منحنی ROC از داده های داده شده مفید است.
ما باید بیشتر بر توزیعهای احتمالی که بهعنوان توابع تخمینی گسسته و پیوسته طبقهبندی میشوند، تمرکز کنیم. در یادگیری ماشین، الگوریتم ساده بیز با این فرض که ویژگیهای ورودی مستقل هستند، به روش احتمالی کار میکند.
احتمال یک حوزه مهم در اکثر برنامه های کاربردی تجاری است زیرا به پیش بینی نتایج آینده از داده ها کمک می کند و گام های بعدی را برمی دارد. دانشمندان داده، تحلیلگران داده و مهندسان یادگیری ماشین اغلب از این مفهوم احتمال استفاده می کنند زیرا وظیفه آنها دریافت ورودی ها و پیش بینی نتایج احتمالی است.
### پایان خبر رسمی