Apa itu Data Mining ?
Data Mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu database dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam database.
Masalah-masalah pada Data Mining:
• Jumlah data yang sangat besar
• Data dengan dimensi tinggi
• Data dengan kompleksitas tinggi
• Membutuhkan aplikasi yang baru dan canggih
1. Estimasi
Untuk menerka sebuah nilai. Metode yang digunakan : Linear Regression, Neural Network, Support Vector Machine, dll
2. Prediksi
Untuk memperkirakan nilai masa mendatang. Metode yang digunakan : Linear
Regerssion, Neural Network, Support Vector Machine, dll
3. Klasifikasi
merupakan proses penemuan model atau fungsi yang menjelaskan atau
membedakan konsep dan kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Metode
yang digunakan :Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Logistic
merupakan proses penemuan model atau fungsi yang menjelaskan atau
membedakan konsep dan kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Metode
yang digunakan :Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Logistic
Regression, dll
4. Klustering
yaitu pengelompokan mengidentifikasi data yang memiliki karakteristik tertentu.
Metode yang digunakan : K-Means, K-Medoids, Self-Organizing Map, Fuzzy C-
Means, dll
5. Asosiasi
dinamakan juga analisis keranjang pasar dimana fungsi ini mengidentifikasi item-item produk yang kemungkinan dibeli konsumen bersamaan dengan produk
lain. Metode yang digunakan : FP-Growth, A Priori, Coefficient of Correlation,
Chi Square, dll
Komentar
Posting Komentar