Kamis, 07 Maret 2013

DATA MINING


Text Mining, Data Mining, dan Web Mining 

text mining atau pendulangan teks adalah kegiatan berbantuan komputer untuk menemukan dan mengambil informasi baru yang sebelumnya tersembunyi, dengan secara otomatis menyarikan berbagai pesan tekstual dari berbagai sumber. Salah satu kemampuan kunci dalam text mining ini adalah kemampuan mengaitkan berbagai informasi menjadi fakta baru atau dugaan baru tentang sesuatu yang ingin dibahas lebih jauh dengan membacanya secara konvensional. 
ataupun dapat didefinisikan sebagai kegiatan mencari informasi berdasarkan dugaan yang sudah lebih jelas tentang apa yang akan dicari dan ditemukan.
         
        Data mining merupakan prinsip dasar dalam mengurutkan data dalam jumlah yang sangat banyak dan mengambil informasi – informasi yang berkaitan dengan apa yang diperlukan seperti apa yang biasa dilakukan oleh seorang analis. Dengan bertambah banyaknya jumlah data yang ada dalam model bisnis yang kita lakukan dalam perusahaan ini, maka peran analis untuk menganalisa data secara manual perlu digantikan dengan aplikasi yang berbasis komputer
Beberapa teknik yang sering digunakan dalam data mining :
        Artificial Neural Network : model prediksi non linear yang melakukan pembelajaran melalu latihan dan menyerupai struktur jaringan nerual yang terdapat pada mahluk hidup.
        Decision Tree : struktur yang berbentuk pohon yang menggambarkan kumpulan keputusan. Decision tree ini akan membentuk aturan klasifikasi dari kumpulan data.
        Genetic Algorithms : teknik optimasi yang menggunakan proses seperti kombinasi genetik, mutasi dan seleksi alam sebagai pola berdasarkan konsep evolusi
        Nearest Neighbor Method : teknik yang mengklasifikasi setiap rekord dalam kumpulan data berdasarkan kombinasi dari klas kumpulan rekord yang mirip dalam kumpulan data historis.
        Rule Induction : ekstraksi aturan sebab-akibat dari data secara statistic

  web mining bertujuan untuk menemukan informasi atau pengetahuan yang
bermanfaat dari struktur web hyperlinks, halaman web, dan data penggunaan web. Berdasarkan jenis data primer yang digunakan dalam proses penggalian informasi.web mining dibagi atas 3 yaitu : web structure mining, web content mining, dan web usage mining.


Tidak ada komentar:

Posting Komentar