ABSTRAKSI: Penggunaan Internet semakin pesat dan orang membutuhkan suatu cara untuk melihat content-content yang penting dari sebuah halaman Web. Hal inilah yang mendorong diciptakannya suatu teknologi untuk mengekstrak content atau informasi dari halaman Web tersebut sehingga dapat mempermudah dalam pembacaan dan analisis. Informasi pada halaman Web dapat berupa teks, gambar, alamat URL dan sebagainya. Karena bentuknya yang semi-structured, untuk mengambil informasi dari halaman Web cukup sulit.
Wrapper merupakan salah satu metode untuk mengekstrak halaman Web. Namun Wrapper mempunyai kelemahan, yaitu tidak adanya proses learning, sehingga sistem berjalan secara manual (hand coded), karena itulah dibuat suatu metode pengembangan dari Wrapper ini yang menyediakan proses learning yaitu Wrapper Induction. Proses learning pada Wrapper Induction ini adalah pada proses generate tag HTML sebagai penentu content-content yang akan diekstrak. Pada Tugas Akhir ini akan dilakukan ekstraksi informasi yang berupa teks berita menggunakan Wrapper Induction dan analisis perfomansi dari Wrapper Induction dalam mengekstrak halaman web berdasarkan Recall, Precision dan F-Measure.Kata Kunci : Wrapper, Wrapper Induction, halaman WebABSTRACT: The using of Internet is increase and people need a technique to get the important contents of a Web page. Because of that case, the technology to extract contents or information of a Web page had been invented, then the Web page can be both read and analyzed easily. Web page contains of many informations such as text, images, URL address and so on. Because of semi-structured, there‟s quite difficult to take information from Web Page.
Wrapper is a one of methods to extract a web page. But, Wrapper has a weakness; it doesn‟t have a learning process, then the system running manually (hand coded). Because of that case, Wrapper Induction which is provided a learning process had developed. Learning process on Wrapper Induction is a process to generate HTML tag to indentify which content will be extract. This Final Project is created to extract text information from news Web page using Wrapper Induction and analyze the performance of Wrapper Induction on extracting a Web page based on Recall, Precision and F-Measure.Keyword: Wrapper, Wrapper Induction, Web page