ADRIANUS BONARDO SILALAHI and BINTANG MAS CAHYA SINAGA and FRANS YOHANES PADANG (2025) KLASIFIKASI ANALISIS SENTIMEN CHAT GPT PADA BIG DATA MULTI PLATFORM DI INDONESIA DENGAN METODE ROBERTA. Undergraduate (S-1) thesis, Universitas Mikroskil.
![[thumbnail of BAGIAN AWAL.pdf]](https://repository.mikroskil.ac.id/style/images/fileicons/text.png)
BAGIAN AWAL.pdf
Download (13MB)
![[thumbnail of BAB I.pdf]](https://repository.mikroskil.ac.id/style/images/fileicons/text.png)
BAB I.pdf
Download (1MB)
![[thumbnail of BAB II.pdf]](https://repository.mikroskil.ac.id/style/images/fileicons/text.png)
BAB II.pdf
Download (17MB)
![[thumbnail of BAB III.pdf]](https://repository.mikroskil.ac.id/style/images/fileicons/text.png)
BAB III.pdf
Restricted to Registered users only
Download (30MB)
![[thumbnail of BAGIAN AKHIR.pdf]](https://repository.mikroskil.ac.id/style/images/fileicons/text.png)
BAGIAN AKHIR.pdf
Download (5MB)
Abstract
Popularitas ChatGPT telah memicu analisis sentimen publik, namun sering kali menghasilkan distribusi data yang tidak seimbang (imbalanced data), di mana sentimen positif jauh mendominasi. Kondisi ini menyebabkan model klasifikasi cenderung bias terhadap kelas mayoritas dan kesulitan mengenali sentimen negatif yang merupakan kelas minoritas, diperparah oleh kurangnya variasi data jika hanya mengandalkan sumber platform tunggal. Penelitian ini mengusulkan pendekatan untuk mengatasi masalah tersebut dengan mengintegrasikan data dari multi-platform (X, YouTube, Google Play Store, Medium) untuk memperkaya variasi data. Selanjutnya, teknik data balancing melalui text augmentation (synonym replacement) diterapkan untuk menangani ketidakseimbangan kelas, dan model RoBERTa digunakan untuk klasifikasi karena kemampuannya yang unggul. Hasil penelitian menunjukkan bahwa penerapan data balancing secara signifikan meningkatkan F1-score pada kelas negatif dari 0.86 menjadi 0.93. Model yang dilatih dengan data multi-platform juga terbukti lebih unggul dibandingkan single-platform. Selain itu, RoBERTa menunjukkan kinerja yang lebih seimbang pada kelas minoritas dibandingkan dengan BERT. Meskipun kedua model memiliki nilai akurasi yang mirip(94%), RoBERTa lebih unggul pada kelas negatif dan netral, yang ditunjukkan oleh nilai recall yang lebih tinggi daripada BERT. Disimpulkan bahwa integrasi data multi-platform, Teknik balancing, dan penggunaan model RoBERTa merupakan strategi efektif untuk membangun sistem analisis sentimen yang andal dan tidak bias.
Item Type: | Tugas Akhir / Tesis (Undergraduate (S-1)) |
---|---|
Subjects: | Teknik Informatika |
Divisions: | Fakultas Informatika > Program Studi S-1 Teknik Informatika |
Depositing User: | Adi Kurniawan |
Date Deposited: | 09 Sep 2025 10:54 |
Last Modified: | 09 Sep 2025 10:54 |
URI: | https://repository.mikroskil.ac.id/id/eprint/4214 |