KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN ALGORITMA MULTINOMIAL NAÏVE BAYES DENGAN INFORMATION GAIN-MAXIMAL MARGINAL RELEVANCE DAN DEEP FEATURE WEIGHTING

LAIKHOMAN and KEVIN CHANTONA (2018) KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN ALGORITMA MULTINOMIAL NAÏVE BAYES DENGAN INFORMATION GAIN-MAXIMAL MARGINAL RELEVANCE DAN DEEP FEATURE WEIGHTING. Undergraduate (S-1) thesis, Universitas Mikroskil.

[thumbnail of BAGIAN AWAL.pdf] Text
BAGIAN AWAL.pdf

Download (6MB)
[thumbnail of BAB I.pdf] Text
BAB I.pdf

Download (2MB)
[thumbnail of BAB II.pdf] Text
BAB II.pdf

Download (12MB)
[thumbnail of BAB III.pdf] Text
BAB III.pdf
Restricted to Registered users only

Download (32MB)
[thumbnail of BAGIAN AKHIR.pdf] Text
BAGIAN AKHIR.pdf

Download (2MB)

Abstract

Klasifikasi berita merupakan permasalahan dengan ruang fitur berdimensi tinggi. Seleksi fitur digunakan untuk mengurangi dimensi fitur dengan menghilangkan fitur irelevan dan redundan tanpa mengurangi nilai akurasi. Klasifikasi menggunakan Multinomial Naïve Bayes dengan seleksi fitur Information Gain dan Maximal Marginal Relevance menunjukkan penurunan akurasi dengan bertambahnya jumlah fitur dibandingkan Maximal Marginal Relevance. Algoritma Naïve Bayes mengasumsikan independensi antar fitur yaitu nilai dari sebuah fitur tidak tergantung pada nilai fitur lainnya pada variabel kelas tertentu sehingga setiap fitur berkontribusi secara independen terhadap probabilitas suatu kelas data. Terdapat metode untuk melemahkan independensi fitur dengan pembobotan fitur pada probabilitas kondisional terhadap sub himpunan fitur terbaik, yaitu Deep Feature Weighting Multinomial Naïve Bayes dengan pemilihan fitur menggunakan Correlation based Feature Selection. Pengujian dilakukan menggunakan beberapa jumlah fitur yang diseleksi. Untuk setiap jumlah fitur yang diseleksi menggunakan nilai antara 0 sampai 1 (inkremen 0,1). Nilai akurasi rata-rata diperoleh dengan pengujian k-fold cross validation dengan nilai k adalah 10. Hasil menunjukkan penerapan Deep Feature Weighting mampu meningkatkan akurasi pada jumlah fitur rendah yaitu 10 pada nilai antara 0 sampai 0,9, sedangkan untuk parameter jumlah fitur lain nilai akurasi turun walaupun tidak signifikan. Untuk semua algoritma, nilai akurasi meningkat secara konsisten seiring dengan bertambahnya jumlah fitur.

Item Type: Tugas Akhir / Tesis (Undergraduate (S-1))
Subjects: Teknik Informatika
Divisions: Fakultas Informatika > Program Studi S-1 Teknik Informatika
Depositing User: Adi Kurniawan
Date Deposited: 23 Mar 2023 05:41
Last Modified: 23 Mar 2023 05:41
URI: https://repository.mikroskil.ac.id/id/eprint/1809

Actions (login required)

View Item
View Item