PENGENALAN DATA MINING

Apa itu Data Mining ?

Data Mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu database dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam database.


Masalah-masalah pada Data Mining:
• Jumlah data yang sangat besar
• Data dengan dimensi tinggi
• Data dengan kompleksitas tinggi
• Membutuhkan aplikasi yang baru dan canggih



Metode-metode pada Data Mining

1. Estimasi
    Untuk menerka sebuah nilai. Metode yang digunakan : Linear Regression,                  Neural Network, Support Vector Machine, dll
2. Prediksi
    Untuk memperkirakan nilai masa mendatang. Metode yang digunakan : Linear    
    Regerssion, Neural Network, Support Vector Machine, dll
3. Klasifikasi
    merupakan proses penemuan model atau fungsi yang menjelaskan atau
    membedakan konsep dan kelas data, dengan tujuan untuk dapat
    memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Metode
    yang digunakan :Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Logistic
    Regression, dll
4. Klustering 
    yaitu pengelompokan mengidentifikasi data yang memiliki karakteristik tertentu. 
    Metode yang digunakan : K-Means, K-Medoids, Self-Organizing Map, Fuzzy C-
    Means, dll
5. Asosiasi
    dinamakan juga analisis keranjang pasar dimana fungsi ini mengidentifikasi item-
    item produk yang kemungkinan dibeli konsumen bersamaan dengan produk 
    lain. Metode yang digunakan :  FP-Growth, A Priori, Coefficient of Correlation,
    Chi Square, dll

Komentar