، اصفهان , (اخبار رسمی): داده کاوی یک فرآیند محاسباتی است که در واقع الگو یا الگوهایی را در مجموعه ای از داده های عظیم کشف میکند . داده کاوی شاخه ای از علوم کامپیوتر است که در واقع ترکیبی از تکنیکهای آماری ، علوم اطلاعات ، یادگیری ماشینی و نظریه پایگاه داده است .
داده کاوی یک فرآیند محاسباتی است که در واقع الگو یا الگوهایی را در مجموعه ای از داده های عظیم کشف میکند . در تمامی تعریف های مرتبط به داده کاوی کلمه کشف کردن را میتوان پیدا کرد . داده کاوی شاخه ای از علوم کامپیوتر است که در واقع ترکیبی از تکنیکهای آماری ، علوم اطلاعات ، یادگیری ماشینی و نظریه پایگاه داده است .
داده کاوی یا Data Mining یکی از تخصصهایی هست که شرکتها به خصوص شرکتهای بزرگ نیاز زیادی بهش دارند و باعث افزایش بهروه وری در سازمان میشود.میتوان گفت اصلی ترین دلیل و توجه به این دانش این است که حجم وسیعی از داده ها وجود داشته و شدیدا این نیاز بوجود آمده بود که باید از این داده ها، اطلاعات و دانش مفیدی استخراج کرد و از آن برای کنترل ، تحلیل و پیش بینی استفاده کرد.
بنابراین می توان اینگونه بیان داشت که: حجم دادهها با سرعت زیادی در حال رشد است. اطلاعات ما در مورد این دادهها کم است.
اجزای اصلی سیستم داده کاوی
- پایگاه داده: مجموعهای از پایگاه داده ها، انباره داده، صفحه گسترده، یا دیگر انواع مخازن اطلاعات، پاکسازی دادهها و تکنیکهای یکپارچه سازی روی این دادهها انجام میشود. سرویس دهنده پایگاه داده: که مسئول بازیابی دادههای مرتبط براساس نوع درخواست داده کاوی کاربر میباشد. پایگاه دانش: این پایگاه از دانش زمینه ای تشکیل شده تا به جستجو کمک کند یا برای ارزیابی الگوهای یافت شده از آن استفاده میشود. موتور داده کاوی: این موتور جزء اصلی سیستم داده کاوی است و به طور ایده آل شامل مجموعهای نظیر کلاس بندی، آنالیز خوشهها و آنالیز تکامل و انحراف است. مقیاس ارزیابی الگو: این جزء معیارهای جذابیت را به کار میبندد و با مقیاس داده کاوی تعامل میکند، بدین صورت که تمرکز آن بر جستجو بین الگوهای جذاب میباشد، و از یک حد آستانه جذابیت استفاده میکند تا الگوهای کشف شده را ارزیابی کند. واسط گرافیکی کاربر: بین کاربر و سیستم داده کاوی ارتباط برقرار میکند، به کاربر اجازه میدهد تا با سیستم داده کاوی از طریق پرس و جو ارتباط برقرار کند. در واقع به کاربر اجازه میدهد تا شمای پایگاه داده یا انباره داده را مرور کرده، الگوهای یافته شده را ارزیابی کرده و الگوها را در فرمهای بصری گوناگون، بازنمایی کند.
تکنیکهای داده کاوی
با استفاده از تکنیکهای داده کاوی، سرعت انجام محاسبات و فضای مورد نیاز در حافظه (RAM) بسیار بهبود پیدا میکند. تقریباً در هر جایی که مقداری داده وجود داشته باشد تکنیکهای داده کاوی نیز کاربرد دارند.تکنیکهای داده کاوی را میتوان در یکی از این سه دسته و یا ترکیبی از آنها قرار داد که در ادامه به بررسی آنها میپردازیم.این تکنیک ها روش های یادگیری ماشین می باشند که برای دسته بندی داده ها و بهبود عملکرد الگوریتم استفاده می شوند.
طبقه بندی (Classification)
در این الگوریتم دادهها طبق ویژگیهای تعریف شده برچسب زده میشوند و در کلاسهای مختلف قرار میگیرند. الگوریتم میتواند مدل برچسب گذاری را یاد بگیرد و با استفاده از همین یادگیری هوشمند، نمونههای جدید را برچسب بزند. در واقع در این روش از نوعی تفکیک داده ای استفاده میشود که الگوریتم بعد از آن، میتواند مدلِ خود را بر روی دادههای جدید اعمال کرده و از این به بعد، به طور خودکار تفکیک داده ای را شناسایی کند.
خوشه بندی (Clustering)
در این نوع یادگیری، الگوریتم توسط ذات دادهها به گروهبندیِ آنها میپردازددر واقع میتوان گفت داده ها بر اساس میزان شباهت به یکدیگر دسته بندی میشوند.برخلاف روش قبلی داده ها برچسب گذاری نمیشود و شناسایی و تفکیک آن توسط خود سیستم و الگوریتم انجام شود.
یادگیری تقویتی (Reinforcement Learning)
در این یادگیری، الگوریتم با تبادل اطلاعات و عملیات با محیط پیرامون، به کشف اطلاعات و یادگیری پیوسته اقدام میکند.در این یادگیری سیستم مدام در حال دریافت فیدبک از محیط می باشد و براساس سیگنال های دریافتی میتواند تشخیص دهد که عملکرد فعلی به نسبت عملکرد پیشین بهبود داشته است یا خیر.
ارتباط بین یادگیری ماشین و داده کاوی
داده کاوی و یادگیری ماشین دو مفهوم نزدیک به هم هستند، به طور کلی میتوان یادگیری ماشین را جزیی از داده کاوی دانست که بر اساس الگوریتم های آن داده ها دسته بندی و بتوان راحت تر بر روی داده ها تحلیل انجام داد.
در واقع در بسیاری از موارد شاهد این خواهیم بود که روشی که برای داده کاوی انجام و پیشنهاد شده است،یک الگوریتم یادگیری ماشین می باشد.تنها تفاوت جزیی یادگیری ماشین و داده کاوی در این موضوع می باشد که در داده کاوی الگوی ناشناخته ای را کشف کرده اما در یادگیری ماشین الگوی شناخته شده و دانش را شروع به باز تولید می کند و به طور خودکار این اطلاعات را به داده ها و اقدامات اعمال می کند.
### پایان خبر رسمی