Data mining یا دادهکاوی چیست؟
مفهوم و اصطلاح دادهکاوی قبل از عصر دیجیتال همراه ما بوده است. ایده استاده از Data mining سالهاست برای کشف دانش گوناگون با فرمولهای دستی مختلف برای تحلیل و بررسی آماری مورد استفاده قرار میگیرد. آلن تورینگ در دهه 1930 ایدهای را در جهت یک ماشین محاسباتی جهانی به صورت پیوسته معرفی کرد. با این طرح میتوانید محاسباتی در حد پیچیده را انجام داد. این فرایند نشانهای برای ظهور رایانههای الکترومکانیکی بوده است.
اگر تا به امروز اطلاعاتی راجب مفهوم دادهکاوی نشنیدهاید ما در این مقاله تصمیم داریم این اطلاعات را به زبانی ساده در اختیارتان قرار بدهیم.
دادهها قسمتی از زندگی و تجارتها شدهاند. امروزه همه شرکت ها Data mining را برای تمامی فرایندهای کاری خود مانند تفسیر مالی, بهبود سازمانی فروش و دیگر اهداف سرمایه گذاری کسب و کارتان استفاده کنید. بررسی این دانش در تمام جهان به صورت حیاتی شده است چرا که همه شرکتها برای رسیدن به اهداف بزرگتر در تلاشاند.
دادهکاوی چیست؟
Data mining روالی است که دادههای مجموعههای بزرگ مرتبسازی میشود که باعث میشود الگوها و روابط پردازش و تجزیه و تحلیل شود و مشکلات تجاری شرکت بهبود یابد.
Data mining بخش مهم در تجزیه و تحلیل دادهها به صورت کلی و از رشتههای اصلی علم داده به حساب میآید. در این بین از تکنیک تجزیه و تحلیل برای درسترسی به اطلاعات مهم و مفید استفاده میشود.
در بخشی جزئی تر Data mining هدفی برای کشف دانش در KDD یا پایگاه داده است. به روشی که در آن اطلاعات داده جمع آوری, تجزیه و تحلیل و پردازش میشود KDD یا دادهکاوی میگویند. ولی در مجموع به عنوان دو چیز متمایز در دید افراد معرفی شدهاند.
Data mining از روش تجزیه و تحلیل داده باعث بهبود بخشیدن به تصمیم گیری سازمانی میشود. البته زیر بنای آنها تکنیکهای مناسبی است که در اختیار شما قرار داده میشود. این امر به دو هدف تقسیم بندی میشود. یکی توصیف مجموع داده و یا به وسیله الگوریتمها و یادگیری ماشینی نتیجهها را پیش بینی کنید. با این روش میتوانید دادهها را فیلتر و یا سازماندهی کنید, بررسی رفتار کاربر, تقصها و تنگناها در زمینه امنیتی را برطرف کنید.
ریشهها و تاریخچه Data mining
دادهکاوی و ذخیره سازی داده و تجزیه و تحلیل در دهه 1980 و اوایل 1990 شروع به فعالیت کردند. با توانایی پیشرفتهای در زمینه تجزیه و تحلیل حجم بالایی از دادهها را که سازمانها ارائه کردهاند را جمع آوری کند. اصطلاحات Data mining تا سال 1995 در حال استفاده بود.
اهمیت Data mining چیست؟
از اهمیت Data mining این است که بخش حیاتی در ابتکارات تحلیلی در سازمانها است. این اطلاعات در زمینه هوش تجاری و برنامه تحلیل پیشرفته داده تاریخی است. همچنین دارای برنامههای تحلیلی بلادرنگ دادههای جریانی را در زمان جمع آوریها بررسی میکند.
کاربردهای دادهکاوی
طی گفتههای بالا Data mining به معنی استخراج اطلاعات مهم و مفید از دادههای خام و نامفهوم است البته این اطلاعات شامل بخشهای مختلفی است. در ادامه کاربردهای دیگر آن را نام میبریم:
- کشف الگوهای میان داده
- پیش بینی نتایج
- رسیدن به اطلاعات کاربردی
- بر روی دادههای بزرگ تمرکز کنید
در مجموع این فرایند به ما کمک میکند دادههای بلا استفاده و نامرتبط را از مجموعه خود حذف کنید. همچنین اطلاعات مفید و مهم را در اختیار ما قرار میدهد و به روال تصمیم گیری سرعت بیشتری میدهد و همبن روال را فالوو یا دنبال میکند تا شما کار ها را ساده تر انجام دهدید.
مشکلات Data mining چیست؟
اکثر این سیستم ها دو مشکل کلی دارد که شامل موارد زیر است:
- در بخش ورودی حجم دادهها بسیار بالا هستند
- از اطلاعات خروجی اطمینان کامل بدست نمیآید
برای برطرف کردن مشکل اول بهتر است از الگوریتمهای سریع , روش کاهش پیچیدگیهای زمانی, پردازش و بهینه سازی و آنالیز و غیره استفاده شود. البته میتوانید از روشهای دیگری که باهم ارتباط دارند چون گسسته سازی, نمونه گیری, کاهش ابعاد و غیره میزان حجم دادهها را بسته به نیاز خود کم کنید.
در دادهکاوی و برای مورد مشکل دوم باید ابتدا ورودیهای خود را بررسی کنید. اگر در این داده اطلاعات به صورت کامل نباشند به گونهای که مشخصههایی باشد که برای آن مقادیر معتبری ثبت نشده باشد و یا اطلاعات لازمه ناسازگار باشد و مقادیر درج شده با واقعی آن در حد یکسانی نباشد باعث عدم اعتماد در اطلاعات خروجی میشود برای برطرف کردن این مشکل بهتر است دادههای ورودی و صحت آن را مورد بررسی قرار دهید.