Knowledge discovery in database & information retrieval

  • Penemuan pola dalam dataset yang besar. Data dapat berupa teks, gambar atau suara.
  • Mendapatkan bagian informasi yang dibutuhkan dari sebuah kumpulan informasi.

Penemuan Pengetahuan dalam Basis Data 

“Proses nontrivial dalam mengidentifikasi pola data yang valid, baru, berpotensi bermanfaat, dan pada akhirnya dapat dipahami” (Fayyad, Piatetsky-Shapiro, dan Smyth, 1996, hal. 30)Juga dikenal sebagai ekstraksi pengetahuan, pengambilan informasi, data arkeologi, dan ekstraksi informasi

Pengambilan Informasi 

“Metode dan proses untuk mencari informasi yang relevan dari sistem informasi yang mengandung jumlah dokumen yang sangat besar” (Rocha, 2001, 1.1)“Tujuan akhir IR adalah untuk menghasilkan atau merekomendasikan informasi yang relevan kepada pengguna” (1.2)“IR Tradisional tidak mengidentifikasi pengguna dan mengklasifikasikan subjek hanya dengan kata kunci dan kategori yang tidak berubah” (1.2)Sistem Informasi Terdistribusi (DIS) adalah kumpulan sumber daya informasi jaringan elektronik (misalnya, basis data) dalam beberapa jenis interaksi dengan komunitas pengguna; contoh sistem tersebut adalah: Internet, World Wide Web, intranet perusahaan, database, sistem pengambilan informasi perpustakaan, dll. DIS melayani komunitas pengguna yang besar dan beragam dengan menyediakan akses ke sejumlah besar sumber daya informasi elektronik yang heterogen. Information Retrieval (IR) mengacu pada semua metode dan proses untuk mencari informasi yang relevan dari sistem informasi (terisolasi atau bagian dari DIS) yang berisi sejumlah besar dokumen. Ketika kompleksitas dan ukuran komunitas pengguna dan sumber daya informasi tumbuh, keterbatasan mendasar dari sistem pencarian informasi tradisional telah menjadi jelas dalam DIS modern.Sistem IR tradisional hanya didasarkan pada kata kunci yang mengindeks dokumen (dengan ciri semantik) dan bahasa permintaan untuk mengambil dokumen dari basis data terpusat sesuai dengan kata kunci ini – pengguna perlu mengetahui cara “menarik” informasi yang relevan dari database pasif. Pengaturan ini menyebabkan sejumlah kelemahan (Rocha dan Bollen, 2000), yang mencegah proses IR tradisional dalam DIS untuk mencapai segala jenis penggandaan yang menarik dengan pengguna. Interaksi manusia-mesin yang diamati dalam sistem ini sangat kaku: Sebagian besar tidak dapat secara proaktif “mendorong” informasi yang relevan kepada penggunanya tentang topik terkait yang mungkin tidak mereka sadari, biasanya tidak ada mekanisme untuk bertukar pengetahuan, atau persimpangan informasi yang relevan antara pengguna dan sumber informasi, dan tidak ada mekanisme untuk menggabungkan kembali pengetahuan dalam sumber daya informasi yang berbeda untuk menyimpulkan kategori linguistik baru dari kata kunci yang digunakan oleh komunitas pengguna yang berkembang. Dengan kata lain, IR tradisional menjaga DIS sebagai repositori data yang statis, pasif, dan terisolasi; tidak ada co-evolusi manusia-mesin yang menarik dari pengetahuan atau pembelajaran yang dicapai (1.1). Rocha, L .. M. (2001). TalkMine: Pendekatan komputasi lunak untuk rekomendasi pengetahuan adaptif [Versi elektronik]. Dalam V. Loia & S. Sessa (Eds.), Studi ketidakjelasan dan komputasi lunak: Vol. 75. Agen komputasi lunak: Tren baru untuk merancang sistem otonom. (pp). New York: Springer. Diakses pada 28 Maret 2003 dari dan repositori data yang terisolasi; tidak ada co-evolusi manusia-mesin yang menarik dari pengetahuan atau pembelajaran yang dicapai (1.1). Rocha, L .. M. (2001). TalkMine: Pendekatan komputasi lunak untuk rekomendasi pengetahuan adaptif [Versi elektronik]. Dalam V. Loia & S. Sessa (Eds.), Studi ketidakjelasan dan komputasi lunak: Vol. 75. Agen komputasi lunak: Tren baru untuk merancang sistem otonom. (pp). New York: Springer. Diakses pada 28 Maret 2003 dari dan repositori data yang terisolasi; tidak ada co-evolusi manusia-mesin yang menarik dari pengetahuan atau pembelajaran yang dicapai (1.1). Rocha, L .. M. (2001). TalkMine: Pendekatan komputasi lunak untuk rekomendasi pengetahuan adaptif [Versi elektronik]. Dalam V. Loia & S. Sessa (Eds.), Studi ketidakjelasan dan komputasi lunak: Vol. 75. Agen komputasi lunak: Tren baru untuk merancang sistem otonom. (pp). New York: Springer.

Institusi yang menggunakan sistem KDD / IR 
Membutuhkan keputusan berbasis pengetahuanMemiliki banyak data yang dapat diakses, relevan, historis dan terkini.Memiliki hasil tinggi untuk keputusan yang benar.Keuangan: perbankan & investasiKedokteran: kesehatan & asuransiPenjualan: pemasaran & hubungan pelanggan( Piatetsky-Shapiro, 1998, Slide 28-31)