Menurut Gonunesco (2011) dikutip oleh Prasetyo (2014) nama data mining sebenarnya mulai dikenal sejak tahun 1990, ketika pekerjaan pemanfaatan data menjadi sesuatu yang penting dalam berbagai bidang, mulai dari akademik, bisnis, hingga medis. Data mining dapat diterapkan pada berbagai bidang yang mempunyai sejumlah data, Daryl Pregibon menyatakan bahwa “data mining adalah campuran dari statistik, kecerdasan buatan, dan riset basis data” yang masih berkembang (Gonunesco, 2011).
Menurut (Prasetyo, 2014) pengertian data mining cukup sulit dijelaskan dengan gambar jika mengingat data mining juga merupakan gabungan dari beberapa bidang ilmu. Berikut terdapat beberapa pengertian data mining yang secara naratif mempunyai beberapa maksud yang mirip yaitu ;
1. Pencarian otomatis pola dalam basis data besar, menggunakan teknik komputasional campuran dari statistik, pembelajaran mesin, dan pengenalan pola.2. Pengekstrakan implisit yang sebelumya belum diketahui secara potensial adalah informasi berguna dari data.
3. Ilmu pengekstrakan informasi yang berguna dari set data atau basis data besar.
4. Eksplorasi otomatis atau semiotomatis dan analisa data dalam jumlah besar, dengan tujuan untuk menemukan pola yang bermakna.
5. Proses penemuan informasi otomatis dengan mengidentifikasi pola dan hubungkan ‘tersembunyi’ dalam data.
Ada istilah lain yang mempunyai makna sama dengan data mining yaitu Knowledge-discovery in database (KDD). Memang Data Mining atau KDD bertujuan untuk memanfaatkan data dalam basis data dengan mengelolanya sehingga menghasilkan informasi baru yang berguna (Gonunescu, 2011 dalam Prasetyo, 2014). Tahapan dari proses KDD secara garis besar adalah sebagai berikut;
1. Data Selectionberkas yang terpisah dari basis data operasional.
2. Pre-Processing/Cleaning
Proses Cleaning diantaranya membuang dublicat data, memberikan data yang inkonsisten, dan memperbaiki kesalahan pada data, selain itu proses cleaning juga melakukan proses encrichment yaitu proses memperkaya data yang sudah ada dengan data yang diperlukan untuk KDD.
3. Transformation
Coding merupakan proses transformasi pada data yang telah terpilih untuk proses data mining. Proses coding dalam KDD adalah proses kreatif dan sangat bergantung pada jenis atau pola informasi yang akan dicari dalam basis data. 4. Data Mining
Data mining merupakan proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan metode tertentu. 5. Interpretation/Evaluation.
Jenis informasi yang telah dihasilkan dari proses Data Mining perlu ditampilkan dalam bentuk yang mudah dipahami oleh pihak yang berkepentingan.
2.3 Fungsi Data Mining
Menurut Yusuf W dkk (2006) dikutip oleh (Citra, 2015) data mining dapat menjalankan fungsi-fungsi sebagai berikut ;
1. Deskripsi
Deskripsi dapat membantu dalam menjelaskan pola dan trend yang terjadi, pola dan trend data sering dideskripsikan. Model data mining harus transparan, sehingga hasilnya dapat mendeskripsikan pola dengan jelas.
2. Estimasi
Estimasi sama dengan deskripsi kecuali variabel targetnya numerik ketimbang kategorikal. Model yang dibuat menggunakan record yang lengkap, yang telah menyediakan nilai variabel target prediktor.
3. Prediksi
Prediksi sama dengan klasifikasi dan estimasi yang membedakannya hanya hasil dalam prediksi yang terjadi dimas yang akan datang.
4. Klasifikasi
Variabel target dalam kasifikasi adalah kategorikal. Mode Data Mining memeriksa set record yang besar, dimana setiap record memiliki informasi variabel target dan set input.
5. Clustering
Pengelompokan record, observasi atau kasus ke dalam objek-objek yang mirip disebut dengan clustering, didalam clustering tidak terdapat variabel target, clustering mencoba menfregmentasi seluruh set data kedalam subgroup yang relatif homogen, dimana kemiripan antar record luar cluster diminimasikan sedangkan kemiripan di dalam record dimaksimalkan.
6. Asosiasi
Asosiasi adalah suatu tugas untuk menemukan atribut-atribut yang terjadi bersamaan yang mencoba menemukan aturan untuk mrngkuantifikasi hubungan antara dua atau lebih atribut.
Posting Komentar