Minggu, 07 Juli 2024

TUGAS PERTEMUAN 1

 PROSES ATAU TAHAPAN DATA MINING

1. Penentuan tujuan: memastikan tujuan penambangan data agar sesuai dengan kebutuhan.

2. Pengumpulan data: mengumpulkan data-data yang sesuai dengan tujuan dan menyimpannya di data warehouse.

3. Persiapan data: merapikan data agar tidak ada yang duplikat, hilang, atau berkualitas buruk.

4. Modeling data: membuat dan menguji beberapa model data dengan algoritma yang dipilih agar sesuai dengan tujuan data mining.

5. Evaluasi data: mengevaluasi kinerja dan validitas model data yang dibuat.

6. Penyajian data: menyajikan hasil data mining dalam bentuk yang mudah dipahami dan bermanfaat bagi pengguna.


CRISP-DM( CROSS-INDUSTRY STANDARD PROCESS FOR DATA MINING)

 CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah sebuah model proses standar yang menggambarkan pendekatan-pendekatan umum yang digunakan oleh para ahli data mining. Model ini adalah model analitik yang paling banyak digunakan. CRISP-DM terdiri dari enam tahap, yaitu:

1. Pemahaman bisnis: menentukan tujuan dan persyaratan proyek data mining sesuai dengan kebutuhan bisnis.

2. Pemahaman data: mengumpulkan, menjelajah, dan menganalisis data yang relevan dengan tujuan data mining.

3. Persiapan data: membersihkan, mengintegrasikan, dan mentransformasi data agar siap untuk pemodelan.

4. Pemodelan: membuat dan menguji beberapa model data dengan menggunakan algoritma-algoritma yang sesuai.

5. Evaluasi: mengevaluasi kinerja dan validitas model data yang dibuat dan memilih model terbaik.

6. Penyebaran: menyajikan atau mengimplementasikan hasil data mining kepada pihak-pihak yang terkait.

SEMMA( SAMPLE, EXPLORE, MODIFYL, MODEL, ASSESS )

 SEMMA adalah singkatan dari Sample, Explore, Modify, Model, dan Assess. Ini adalah sebuah model proses yang dikembangkan oleh SAS Institute, salah satu produsen perangkat lunak statistik dan bisnis intelligence. Model ini membimbing pelaksanaan proyek data mining dengan menekankan pada pengembangan dan penilaian model. Berikut adalah penjelasan singkat tentang masing-masing tahap SEMMA:


Sample: Tahap ini bersifat opsional, yaitu mengambil sampel data dari kumpulan data yang besar untuk menampung informasi yang signifikan, namun dapat dimanipulasi dengan cepat.

Explore: Tahap ini adalah mengeksplorasi data yang sudah dikumpulkan dengan mencari tren dan anomali yang tak terduga dalam rangka untuk mendapatkan pemahaman dan ide-ide.

Modify: Tahap ini adalah memodifikasi data dengan menciptakan, menyeleksi, dan mentransformasi variabel-variabel untuk fokus pada proses pemilihan model.

Model: Tahap ini adalah memodelkan data yang sudah dimodifikasi dengan menggunakan perangkat lunak untuk mencari secara otomatis kombinasi data yang dapat diandalkan untuk memprediksi hasil yang diinginkan.

Assess: Tahap ini adalah menilai data dengan mengevaluasi kegunaan dan keandalan penemuan dari proses data mining dan mengevaluasi sebaik mana model tersebut bekerja.

CCC(COMPUTATIONAL, COGNITIVE, AND COMMMUNICATION)

 CCC (Computational, Cognitive, and Communication) adalah sebuah model pendidikan yang mengintegrasikan tiga keterampilan penting untuk masa depan, yaitu:

Computational: kemampuan untuk berpikir secara logis, sistematis, dan kreatif dalam menyelesaikan masalah dengan menggunakan prinsip-prinsip ilmu komputer.

Cognitive: kemampuan untuk memahami, menganalisis, dan mengaplikasikan konsep-konsep dari berbagai bidang ilmu pengetahuan dan teknologi.

Communication: kemampuan untuk berkomunikasi secara efektif, baik lisan maupun tulisan, dengan menggunakan bahasa, media, dan teknologi yang sesuai.

Tidak ada komentar:

Posting Komentar

TUGAS PERTEMUAN 1

 PROSES ATAU TAHAPAN DATA MINING 1. Penentuan tujuan: memastikan tujuan penambangan data agar sesuai dengan kebutuhan. 2. Pengumpulan data: ...