اطلاعات تماس
[نمایش اطلاعات]
کد: 139904174413110978

داده کاوی چیست؟

کد: 139904174413110978

https://bit.ly/3gD5YCJ

، اصفهان , (اخبار رسمی): داده کاوی یک فرآیند محاسباتی است که در واقع الگو یا الگوهایی را در مجموعه ای از داده های عظیم کشف میکند . داده کاوی شاخه ای از علوم کامپیوتر است که در واقع ترکیبی از تکنیکهای آماری ، علوم اطلاعات ، یادگیری ماشینی و نظریه پایگاه داده است .

داده کاوی یک فرآیند محاسباتی است که در واقع الگو یا الگوهایی را در مجموعه ای از داده های عظیم کشف میکند . در تمامی تعریف های مرتبط به داده کاوی کلمه کشف کردن را میتوان پیدا کرد . داده کاوی شاخه ای از علوم کامپیوتر است که در واقع ترکیبی از تکنیکهای آماری ، علوم اطلاعات ، یادگیری ماشینی و نظریه پایگاه داده است .

داده کاوی یا Data Mining یکی از تخصص‌هایی هست که شرکت‌‌ها به خصوص شرکت‌های بزرگ نیاز زیادی بهش دارند و باعث افزایش بهروه وری در سازمان میشود.میتوان گفت اصلی ترین دلیل و توجه به این دانش این است که حجم وسیعی از داده ها وجود داشته و شدیدا این نیاز بوجود آمده بود که باید از این داده ها، اطلاعات و دانش مفیدی استخراج کرد و از آن برای کنترل ، تحلیل و پیش بینی استفاده کرد.

 بنابراین می توان اینگونه بیان داشت که: حجم داده‌ها با سرعت زیادی در حال رشد است. اطلاعات ما در مورد این داده‌ها کم است.

اجزای اصلی سیستم داده کاوی

  • پایگاه داده: مجموعه‌ای از پایگاه داده ها، انباره داده، صفحه گسترده، یا دیگر انواع مخازن اطلاعات، پاکسازی داده‌ها و تکنیک‌های یکپارچه سازی روی این داده‌ها انجام می‌شود. سرویس دهنده پایگاه داده: که مسئول بازیابی داده‌های مرتبط براساس نوع درخواست داده کاوی کاربر می‌باشد. پایگاه دانش: این پایگاه از دانش زمینه ای تشکیل شده تا به جستجو کمک کند یا برای ارزیابی الگوهای یافت شده از آن استفاده می‌شود. موتور داده کاوی: این موتور جزء اصلی سیستم داده کاوی است و به طور ایده آل شامل مجموعه‌ای نظیر کلاس بندی، آنالیز خوشه‌ها و آنالیز تکامل و انحراف است. مقیاس ارزیابی الگو: این جزء معیارهای جذابیت را به کار می‌بندد و با مقیاس داده کاوی تعامل می‌کند، بدین صورت که تمرکز آن بر جستجو بین الگوهای جذاب می‌باشد، و از یک حد آستانه جذابیت استفاده می‌کند تا الگوهای کشف شده را ارزیابی کند. واسط گرافیکی کاربر: بین کاربر و سیستم داده کاوی ارتباط برقرار می‌کند، به کاربر اجازه می‌دهد تا با سیستم داده کاوی از طریق پرس و جو ارتباط برقرار کند. در واقع به کاربر اجازه می‌دهد تا شمای پایگاه داده یا انباره داده را مرور کرده، الگوهای یافته شده را ارزیابی کرده و الگوها را در فرم‌های بصری گوناگون، بازنمایی کند.

تکنیک‌های داده کاوی

با استفاده از تکنیک‌های داده کاوی، سرعت انجام محاسبات و فضای مورد نیاز در حافظه (RAM) بسیار بهبود پیدا می‌کند. تقریباً در هر جایی که مقداری داده وجود داشته باشد تکنیک‌های داده کاوی نیز کاربرد دارند.تکنیک‌های داده کاوی را می‌توان در یکی از این سه دسته و یا ترکیبی از آن‌ها قرار داد که در ادامه به بررسی آن‌ها می‌پردازیم.این تکنیک ها روش های یادگیری ماشین می باشند که برای دسته بندی داده ها و بهبود عملکرد الگوریتم استفاده می شوند.

طبقه بندی (Classification)

در این الگوریتم داده‌ها طبق ویژگی‌های تعریف شده برچسب زده می‌شوند و در کلاس‌های مختلف قرار می‌گیرند. الگوریتم می‌تواند مدل برچسب گذاری را یاد بگیرد و با استفاده از همین یادگیری هوشمند، نمونه‌های جدید را برچسب بزند. در واقع در این روش از نوعی تفکیک داده ای استفاده میشود که الگوریتم بعد از آن، می‌تواند مدلِ خود را بر روی داده‌های جدید اعمال کرده و از این به بعد، به طور خودکار تفکیک داده ای را شناسایی کند.

خوشه بندی (Clustering)

در این نوع یادگیری، الگوریتم توسط ذات داده‌ها به گروه‌بندیِ آن‌ها می‌پردازددر واقع میتوان گفت داده ها بر اساس میزان شباهت به یکدیگر دسته بندی میشوند.برخلاف روش قبلی داده ها برچسب گذاری نمیشود و شناسایی و تفکیک آن توسط خود سیستم و الگوریتم انجام شود.

یادگیری تقویتی (Reinforcement Learning)

در این یادگیری، الگوریتم با تبادل اطلاعات و عملیات با محیط پیرامون، به کشف اطلاعات و یادگیری پیوسته اقدام می‌کند.در این یادگیری سیستم مدام در حال دریافت فیدبک از محیط می باشد و براساس سیگنال های دریافتی میتواند تشخیص دهد که عملکرد فعلی به نسبت عملکرد پیشین بهبود داشته است یا خیر.

ارتباط بین یادگیری ماشین و داده کاوی

داده کاوی و یادگیری ماشین دو مفهوم نزدیک به هم هستند، به طور کلی میتوان یادگیری ماشین را جزیی از داده کاوی دانست که بر اساس الگوریتم های آن داده ها دسته بندی و بتوان راحت تر بر روی داده ها تحلیل انجام داد.

در واقع در بسیاری از موارد شاهد این خواهیم بود که روشی که برای داده کاوی انجام و پیشنهاد شده است،یک الگوریتم یادگیری ماشین می باشد.تنها تفاوت جزیی یادگیری ماشین و داده کاوی در این موضوع می باشد که در داده کاوی الگوی ناشناخته ای را کشف کرده اما در یادگیری ماشین الگوی شناخته شده و دانش را شروع به باز تولید می کند و به طور خودکار این اطلاعات را به داده ها و اقدامات اعمال می کند.

### پایان خبر رسمی

اخبار رسمی هویت منتشر کننده را تایید می‌کند ولی مسئولیت صحت مطلب منتشر شده بر عهده ناشر است.

پروفایل ناشر گزارش تخلف
درباره منتشر کننده:

شرکت مهندسی کسرا

شرکت مهندسی کسرا؛ ارایه کننده راهکارهای جامع تحت وب در حوزه منابع انسانی

اطلاعات تماس
[نمایش اطلاعات]
منتشر شده در سرویس:

علم و آموزش