Text Mining, Data Mining, dan Web Mining
text mining atau pendulangan teks adalah kegiatan
berbantuan komputer untuk menemukan dan mengambil informasi baru yang
sebelumnya tersembunyi, dengan secara otomatis menyarikan berbagai pesan
tekstual dari berbagai sumber. Salah satu kemampuan kunci dalam text mining ini
adalah kemampuan mengaitkan berbagai informasi menjadi fakta baru atau dugaan
baru tentang sesuatu yang ingin dibahas lebih jauh dengan membacanya secara
konvensional.
ataupun dapat didefinisikan sebagai kegiatan mencari informasi berdasarkan dugaan yang sudah lebih jelas tentang apa yang akan dicari dan ditemukan.
Data mining merupakan prinsip dasar dalam mengurutkan data dalam jumlah yang sangat banyak dan mengambil informasi – informasi yang berkaitan dengan apa yang diperlukan seperti apa yang biasa dilakukan oleh seorang analis. Dengan bertambah banyaknya jumlah data yang ada dalam model bisnis yang kita lakukan dalam perusahaan ini, maka peran analis untuk menganalisa data secara manual perlu digantikan dengan aplikasi yang berbasis komputer
ataupun dapat didefinisikan sebagai kegiatan mencari informasi berdasarkan dugaan yang sudah lebih jelas tentang apa yang akan dicari dan ditemukan.
Data mining merupakan prinsip dasar dalam mengurutkan data dalam jumlah yang sangat banyak dan mengambil informasi – informasi yang berkaitan dengan apa yang diperlukan seperti apa yang biasa dilakukan oleh seorang analis. Dengan bertambah banyaknya jumlah data yang ada dalam model bisnis yang kita lakukan dalam perusahaan ini, maka peran analis untuk menganalisa data secara manual perlu digantikan dengan aplikasi yang berbasis komputer
Beberapa teknik yang
sering digunakan dalam data mining :
Artificial
Neural Network : model prediksi non linear yang melakukan pembelajaran melalu
latihan dan menyerupai struktur jaringan nerual yang terdapat pada mahluk
hidup.
Decision
Tree : struktur yang berbentuk pohon yang menggambarkan kumpulan keputusan.
Decision tree ini akan membentuk aturan klasifikasi dari kumpulan data.
Genetic
Algorithms : teknik optimasi yang menggunakan proses seperti kombinasi genetik,
mutasi dan seleksi alam sebagai pola berdasarkan konsep evolusi
Nearest
Neighbor Method : teknik yang mengklasifikasi setiap rekord dalam kumpulan data
berdasarkan kombinasi dari klas kumpulan rekord yang mirip dalam kumpulan data
historis.
Rule
Induction : ekstraksi aturan sebab-akibat dari data secara statistic
web
mining bertujuan untuk menemukan informasi atau pengetahuan yang
bermanfaat dari struktur web hyperlinks, halaman web, dan data penggunaan web. Berdasarkan jenis data primer yang digunakan dalam proses penggalian informasi.web mining dibagi atas 3 yaitu : web structure mining, web content mining, dan web usage mining.
bermanfaat dari struktur web hyperlinks, halaman web, dan data penggunaan web. Berdasarkan jenis data primer yang digunakan dalam proses penggalian informasi.web mining dibagi atas 3 yaitu : web structure mining, web content mining, dan web usage mining.
Tidak ada komentar:
Posting Komentar