ABSTRAKSI: Saat ini semakin banyak para pedagang yang menawarkan produknya melalui internet. Mereka biasanya meminta pelanggan untuk memberikan review atas produk yang dibelinya. Hal tersebut bertujuan untuk mempermudah calon pembeli lain menentukan produk apa yang akan dibelinya. Banyaknya review yang diberikan membuat para calon pembeli kesulitan dalam membaca satu persatu review yang ada. Oleh sebab itu, pada Tugas Akhir ini dibangun sebuah sistem yang dapat melakukan suatu mining dalam review yang ada tersebut.
Proses mining yang dilakukan disebut opinion mining atau analisis sentimen. Dimana hasil yang diharapkan adalah mengetahui apakah suatu kalimat tersebut merupakan kalimat opini positif atau negatif. Tugas Akhir ini berorientasi pada feature-based opinion dimana orientasi opini ditentukan, sebelum terlebih dahulu mengekstrak entitas produk yang dikomentari. Proses pertama yang dilakukan adalah mengekstrak fitur beserta opini yang mengikutinya, kemudian mengekstrak kalimat opini, dan terakhir menentukan orientasi opini (positif atau negatif). Metode yang digunakan dalam sistem ini adalah Lexicalized Hidden Markov Model (L-HMM) yang mengintegrasikan fitur linguistik, seperti part-of-speech, menjadi sebuah mesin pembelajaran otomatis. Sistem ini diharapkan mampu mengenali kosakata baru yang belum muncul pada data latih, yang akan diterapkan bersama dengan teknik smoothing. Dalam memperoleh data train beserta fitur, opini dan orientasinya dalam jumlah banyak, dilakukan teknik bootstrapping.
Hasil pengujian yang diberikan menunjukkan bahwa teknik bootstrapping dapat digunakan untuk memperkaya data latih yang digunakna. Selain itu, penggunaan L-HMM mampu mengekstraksi dengan baik fitur beserta orientasi opini dalam suatu kalimat.Kata Kunci : data mining, sentiment analysis, feature-based opinion, part-of-speech, lexicalized hidden markov models (L-HMM)ABSTRACT: Nowadays, there are merchants selling their product on the web. They usually ask their customer to give a review about product they have purchased. It will make another potential customer being easier to make a decision for buying a product they will bought. The amounts of the review will make the potential customer difficult for reading each of the review. Therefore, this thesis aims to mining an opinion on the review.
Process mining in this thesis is called opinion mining or sentiment analysis. Where the output was to determine whether a sentence is a sentence positive or negative opinions. This thesis oriented feature-based opinion in which subjective orientation is determined, prior to first extract the product entities commented. The first process is to extract features and their opinions are followed, then extract subjective sentences, and finally determine the orientation of opinion (positive or negative). The method used in this system is Lexicalized Hidden Markov Model (LHMM) that integrates linguistic features, such as part-of-speech, into an automated machine learning. The system is expected to be able to recognize the new vocabulary trainer has not shown up in the data, which will be implemented together with the smoothing technique. In obtaining the data train and its features, opinion and orientation in large quantities, do bootstrapping techniques.
The test results show that given bootstrapping techniques can be used to enrich the data used directly trainer. In addition, the use of L-HMM capable of extracting features and their orientation with good opinions in a sentence.Keyword: data mining, sentiment analysis, feature-based opinion, part-of-speech, lexicalized hidden markov models (L-HMM)