MACHFUD, MUGHNIY (2019) IMPLEMENTASI ALGORITMA C4.5 PADA KASUS IMBALANCED CLASS DISTRIBUTION UNTUK PENENTUAN JURUSAN DI SEKOLAH MENENGAH ATAS. Other thesis, Universitas Pesantren Tinggi Darul 'Ulum.
Full text not available from this repository.Abstract
Penentuan jurusan di SMA Negeri 1 Jogoroto, Jombang, Jawa Timur tidak hanya melibatkan keinginan siswa dan tes peminatan, tetapi juga dilengkapi dengan nilai rapor siswa selama masa pendidikan di tingkat SMP, nilai Ujian Nasional (UN), rekomendasi orang tua, serta rekomendasi guru Bimbingan Konseling (BK) samasa pendidikan di SMP, sesuai dengan kurikulum 2013. Selama ini. sekolah menggunakan proses konvensional dalam menentukan jurusan, yaitu menggunakan Microsoft Excel, yang yang cenderung lama serta rawan akan kekeliruan dalam melakukan penghitungan. Penentuan jurusan ini dilakukan setiap awal ajaran baru pada siswa baru kelas X. Ratarata setiap tahun, sekolah mengelola siswa sejumlah 290 dengan waktu dan sumber daya manusia (SDM) yang terbatas. Permasalahan ini telah menjadi perhatian banyak peneliti. Diantaranya mengusulkan untuk menerapkan Educational Data Mining berbasis klasifikasi dengan menggunakan algoritma kombinasi antara algoritma kNN dan SMART, ada pula yang menggunakan algoritma ID3. Namun, tidak semua data cocok menggunakan algoritma itu dari sisi karakteristik atribut datanya. Pada penelitian ini, penggunaan algoritma ID3 tidak cocok karena data bertipe numerik, sedangkan ID3 hanya mampu menggunakan data bertipe nomial maupun polinomial, sehingga diganti algoritma C4.5. Namun, beberapa penelitian mengatakan algoritma C4.5 memiliki kinerja kurang bagus dibandingkan algoritma Gradient Boosting Trees, Random Forests, dan Deep Learning. Untuk itu, dilakukan perbandingan antara keempat metode tersebut untuk melihat keefektifannya dalam menentukan jurusan di SMA. Data yang digunakan pada penelitian ini adalah data penerimaan siswa baru tahun ajaran 2018/2019. Hasil dari penelitian ini menunjukkan jika atribut nilai rapor, pilihan siswa, pilihan orang tua, rekomendasi guru BK maupun hasil tes peminatan bertipe polinomial, algoritma Deep Learning memiliki kinerja paling unggul untuk semua algoritma jika menggunakan fungsi activation ExpRectifier. Sedangkan jika atributnya bertipe numerik, algoritma Deep Learning memiliki kinerja paling unggul untuk semua algoritma jika menggunakan fungsi Tanh untuk semua random sampling. Namun, Deep Learning memiliki kinerja paling buruk untuk semua algoritma jika menggunakan loss Function berupa absolut. Kata kunci: C4.5, Deep Learning, Gradient Boosting Trees, Penentuan Jurusan, Random Forest, SMA.
Item Type: | Thesis (Other) |
---|---|
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Fakultas Sains dan Teknologi Fakultas Sains dan Teknologi > Sistem Informasi |
Depositing User: | Iqbal Iqbal |
Date Deposited: | 30 Nov 2019 03:03 |
Last Modified: | 30 Nov 2019 03:03 |
URI: | http://eprints.unipdu.ac.id/id/eprint/1828 |
Actions (login required)
Downloads
Downloads per month over past year
View Item |