Penelitian ini bertujuan melakukan evaluasi kinerja algoritma k-Nearest Neighbor (k-NN) pada analisis sentimen terhadap kesulitan mahasiswa dalam menentukan topik skripsi berdasarkan cuitan dari media sosial X. Data diambil dari proses crawling dengan kata kunci terkait skripsi, kemudian diproses melalui beberapa tahapan preprocessing (cleaning, tokenisasi, normalisasi, dan lainnya). Sentimen setiap cuitan ditentukan secara otomatis menggunakan tiga pendekatan leksikal: TextBlob, SentiWordNet, dan VADER, dengan pengambilan label mayoritas. Penelitian ini membandingkan tiga skenario preprocessing (stemming, lemmatization, tanpa keduanya) dan tiga skenario ekstraksi fitur berbasis TF-IDF dan N-Gram (unigram, bigram, trigram), serta menguji efektivitas nilai k pada algoritma k-NN menggunakan validasi silang (K-Fold). Hasil menunjukkan bahwa skenario lemmatization menghasilkan akurasi tertinggi sebesar 64,77%, dengan kombinasi fitur unigram + bigram sebagai konfigurasi terbaik. Nilai k terbaik adalah k=1, sementara akurasi menurun secara signifikan seiring bertambahnya nilai k. Secara keseluruhan, k-NN menunjukkan performa yang baik dalam skala kecil, namun kurang efisien untuk data berukuran besar.