KLASIFIKASI ANALISIS SENTIMEN CHAT GPT PADA BIG DATA MULTI PLATFORM DI INDONESIA DENGAN METODE ROBERTA

ADRIANUS BONARDO SILALAHI and BINTANG MAS CAHYA SINAGA and FRANS YOHANES PADANG (2025) KLASIFIKASI ANALISIS SENTIMEN CHAT GPT PADA BIG DATA MULTI PLATFORM DI INDONESIA DENGAN METODE ROBERTA. Undergraduate (S-1) thesis, Universitas Mikroskil.

[thumbnail of BAGIAN AWAL.pdf] Text
BAGIAN AWAL.pdf

Download (13MB)
[thumbnail of BAB I.pdf] Text
BAB I.pdf

Download (1MB)
[thumbnail of BAB II.pdf] Text
BAB II.pdf

Download (17MB)
[thumbnail of BAB III.pdf] Text
BAB III.pdf
Restricted to Registered users only

Download (30MB)
[thumbnail of BAGIAN AKHIR.pdf] Text
BAGIAN AKHIR.pdf

Download (5MB)

Abstract

Popularitas ChatGPT telah memicu analisis sentimen publik, namun sering kali menghasilkan distribusi data yang tidak seimbang (imbalanced data), di mana sentimen positif jauh mendominasi. Kondisi ini menyebabkan model klasifikasi cenderung bias terhadap kelas mayoritas dan kesulitan mengenali sentimen negatif yang merupakan kelas minoritas, diperparah oleh kurangnya variasi data jika hanya mengandalkan sumber platform tunggal. Penelitian ini mengusulkan pendekatan untuk mengatasi masalah tersebut dengan mengintegrasikan data dari multi-platform (X, YouTube, Google Play Store, Medium) untuk memperkaya variasi data. Selanjutnya, teknik data balancing melalui text augmentation (synonym replacement) diterapkan untuk menangani ketidakseimbangan kelas, dan model RoBERTa digunakan untuk klasifikasi karena kemampuannya yang unggul. Hasil penelitian menunjukkan bahwa penerapan data balancing secara signifikan meningkatkan F1-score pada kelas negatif dari 0.86 menjadi 0.93. Model yang dilatih dengan data multi-platform juga terbukti lebih unggul dibandingkan single-platform. Selain itu, RoBERTa menunjukkan kinerja yang lebih seimbang pada kelas minoritas dibandingkan dengan BERT. Meskipun kedua model memiliki nilai akurasi yang mirip(94%), RoBERTa lebih unggul pada kelas negatif dan netral, yang ditunjukkan oleh nilai recall yang lebih tinggi daripada BERT. Disimpulkan bahwa integrasi data multi-platform, Teknik balancing, dan penggunaan model RoBERTa merupakan strategi efektif untuk membangun sistem analisis sentimen yang andal dan tidak bias.

Item Type: Tugas Akhir / Tesis (Undergraduate (S-1))
Subjects: Teknik Informatika
Divisions: Fakultas Informatika > Program Studi S-1 Teknik Informatika
Depositing User: Adi Kurniawan
Date Deposited: 09 Sep 2025 10:54
Last Modified: 09 Sep 2025 10:54
URI: https://repository.mikroskil.ac.id/id/eprint/4214

Actions (login required)

View Item
View Item