Ekstraksi Teks pada Halaman Web Berita Menggunakan Wrapper Induction<br>Text Extraction from News Web Page Using Wrapper Induction

Mizana Khusnu Perdani

Informasi Dasar

109 kali
113088042
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Penggunaan Internet semakin pesat dan orang membutuhkan suatu cara untuk melihat content-content yang penting dari sebuah halaman Web. Hal inilah yang mendorong diciptakannya suatu teknologi untuk mengekstrak content atau informasi dari halaman Web tersebut sehingga dapat mempermudah dalam pembacaan dan analisis. Informasi pada halaman Web dapat berupa teks, gambar, alamat URL dan sebagainya. Karena bentuknya yang semi-structured, untuk mengambil informasi dari halaman Web cukup sulit.

Wrapper merupakan salah satu metode untuk mengekstrak halaman Web. Namun Wrapper mempunyai kelemahan, yaitu tidak adanya proses learning, sehingga sistem berjalan secara manual (hand coded), karena itulah dibuat suatu metode pengembangan dari Wrapper ini yang menyediakan proses learning yaitu Wrapper Induction. Proses learning pada Wrapper Induction ini adalah pada proses generate tag HTML sebagai penentu content-content yang akan diekstrak. Pada Tugas Akhir ini akan dilakukan ekstraksi informasi yang berupa teks berita menggunakan Wrapper Induction dan analisis perfomansi dari Wrapper Induction dalam mengekstrak halaman web berdasarkan Recall, Precision dan F-Measure.Kata Kunci : Wrapper, Wrapper Induction, halaman WebABSTRACT: The using of Internet is increase and people need a technique to get the important contents of a Web page. Because of that case, the technology to extract contents or information of a Web page had been invented, then the Web page can be both read and analyzed easily. Web page contains of many informations such as text, images, URL address and so on. Because of semi-structured, there‟s quite difficult to take information from Web Page.

Wrapper is a one of methods to extract a web page. But, Wrapper has a weakness; it doesn‟t have a learning process, then the system running manually (hand coded). Because of that case, Wrapper Induction which is provided a learning process had developed. Learning process on Wrapper Induction is a process to generate HTML tag to indentify which content will be extract. This Final Project is created to extract text information from news Web page using Wrapper Induction and analyze the performance of Wrapper Induction on extracting a Web page based on Recall, Precision and F-Measure.Keyword: Wrapper, Wrapper Induction, Web page

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Ekstraksi Teks pada Halaman Web Berita Menggunakan Wrapper Induction
Text Extraction from News Web Page Using Wrapper Induction
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Mizana Khusnu Perdani
Perorangan
Arie Ardiyanti Suryani, Yanuar Firdaus A.W.
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini