Di sebagian besar kota besar dengan tingkat kepadatan penduduk yang tinggi, ada banyak masalah yang timbul dikarenakan kemacetan lalu lintas seperti yang terjadi di kota-kota metropolitan Indonesia. Faktor penyebab dari kemacetan lalu lintas adalah kepadatan penduduk, jumlah kendaraan yang terlalu banyak, serta pengaturan lampu lalu lintas yang tidak sesuai dengan kondisi pada persimpangan saat itu. Jika lampu lalu lintas dapat diatur warna lampu yang menyala dan lama waktu menyala sesuai dengan keadaan pada lampu merah tersebut (adaptif), tentunya hal ini akan membantu mengurangi kemacetan. Pada dasarnya, masalah utama dalam traffic light control adalah keharusan membuat keputusan secara sekuensial. Salah satu metode yang cocok dengan karakteristik permasalahan tersebut adalah Markov Decision Process (MDPs) dan Reinforcement Learning (RL) atau approximate dynamic programming (ADP). Dengan latar belakang tersebut dan hasil penelitian-penelitian sebelumnya, penulis mengembangkan sebuah aplikasi simulasi terkait Intelligent Traffic Light Control dengan metode Collaborative Q-Learning.Tujuan dari penelitian tugas akhir ini adalah untuk mengoptimasi waiting time pada traffic light control berdasarkan metode collaborative Q-learning yang dapat dijadikan model referensi untuk solusi kemacetan lalu-lintas di dunia nyata. Berdasarkan hasil pengujian, dapat disimpulkan bahwa metode Collaborative Q-Learning Algorithms merupakan algoritma traffic light control yang paling baik diantara metode lain yang diuji dengan waiting time sebesar 54,67 detik. Simulasi menggunakan simulator Green Light District. Hasil pengujian menunjukkan bahwa parameter terbaik untuk metode Collaborative Q-Learning algorithms adalah learning rate bernilai 1 dan discount factor bernilai 0.8 dengan metode immediate reward berupa hasil pengurangan waiting time sebelumnya dengan waiting time saat ini.
Kata Kunci : Intelligent Traffic Light Control, Reinforcement Learning, waiting time, Collaborative Q-Learning Algorithm, Persimpangan, Optimasi