YouTube salah satu platform media sosial populer yang penggunanya bisa mengunggah video dan berkomentar di video tersebut. Video yang bisa di temukan adalah mengenai sepak bola timnas Indonesia senior di piala ASEAN 2024, bisa berupa cuplikan pertandingan hingga konten kreator yang membahas pertandingan tersebut. Di Indonesia, olahraga sepak bola sangat populer, dengan kepopulerannya ini banyak dari penonton berkomentar mengenai performa timnas sepak bola Indonesia senior di piala ASEAN 2024 pada pertandingan. Namun, tidak sedikit komentar yang diberikan merupakan komentar yang toxic bisa berupa penghinaan, pelecehan dan rasisme yang dilontarkan untuk pemain bahkan pelatih. Tujuan dari penelitian ini adalah untuk mendeteksi kalimat toxic dan klasifikasi menggunakan metode IndoBERT. Penelitian ini mengumpulkan 7.641 komentar bahasa Indonesia dari YouTube mengenai penampilan timnas Indonesia di piala ASEAN 2024, dengan rincian label toxic 1.921 komentar dan non-toxic 5.719 komentar. Dengan ketidakseimbangan ini digunakan teknik bernama augmentasi data untuk mengatasi masalah tersebut. Dataset dibagi menjadi persentase 80% data training dan 20% data test serta tambahan teknik regularisasi seperti weight decay dan dropout. IndoBERT berhasil mendeteksi komentar toxic dan mendapatkan hasil klasifikasi paling baik dan seimbang pada data training dan test dengan hasil Accuracy 90.73%, Precision 93.63%, Recall 87.41%, F1-Score 90.40% pada kombinasi parameter dropout 0.5, Epoch 5, batch size 32, learning rate 2e5 dan tambahan teknik augmentasi data sinonim. Penggunaan augmentasi data berhasil meningkatkan hasil model pada data test.