Bhirawa, Dwi Hasta Adhi (2019) Implementation Of The Nazief & Adriani Method Using N-Gram And Sørensen-Dice Coefficient In Typography Error Checking For Indonesian. undergraduate thesis, Universitas Muhammadiyah Gresik.
Text
2019_TA_TIF_14622030_Lembar Keaslian.pdf Download (224kB) |
||
Text
2019_TA_TIF_14622030_Lembar Pengesahan.pdf Download (253kB) |
||
Text
2019_TA_TIF_14622030_Lembar Persetujuan Skripsi.pdf Download (167kB) |
||
Text
2019_TA_TIF_14622030_Lembar Persetujuan Publikasi.pdf Download (246kB) |
||
Text
2019_TA_TIF_14622030_Halaman Judul.pdf Download (2MB) |
||
|
Text
2019_TA_TIF_14622030_Bab 1.pdf Download (2MB) | Preview |
|
|
Text
2019_TA_TIF_14622030_Bab 2.pdf Download (4MB) | Preview |
|
|
Text
2019_TA_TIF_14622030_Bab 3.pdf Download (10MB) | Preview |
|
Text
2019_TA_TIF_14622030_Bab 4.pdf Restricted to Repository staff only Download (5MB) | Request a copy |
||
|
Text
2019_TA_TIF_14622030_Bab 5.pdf Download (1MB) | Preview |
|
Text
2019_TA_TIF_14622030_Lampiran.pdf Download (655kB) |
||
Text
Daftar Pustaka.pdf Download (142kB) |
Abstract
Information Retrieval adalah studi tentang bagaimana data dapat ditemukan dari berbagai sumber atau kumpulan informasi relevan yang sedang dicari atau dibutuhkan. Ini melibatkan tindakan seperti pengindeksan, pencarian, dan pemanggilan kembali data, yang juga dikenal sebagai information retrieval. Data dapat mencakup teks, tabel, gambar, video, dan audio. Dalam Information Retrieval, preprocessing merupakan langkah penting, karena mengubah data input menjadi format yang sesuai dan siap untuk diproses. Metode stemming menggunakan algoritma Nazief & Adriani mematuhi kaidah morfologi bahasa Indonesia, mengklasifikasikan afiks ke dalam kategori seperti afiks yang diizinkan atau tidak diizinkan. Klasifikasi ini mencakup prefiks, sufiks, infiks, dan kombinasi afiks di awal dan akhir kata dasar (misalnya, dalam "membenarkan," yang mencakup afiks -me dan -kan yang diterapkan pada kata dasar "benar"). Penelitian ini akan difokuskan pada stemming kata-kata berafiks menggunakan metode Nazief & Adriani yang dikombinasikan dengan metode N-Gram dan Sorensen Dice Coefficient. Dalam pendekatan ini, untuk setiap kata yang kata dasarnya atau bentuk dasarnya tidak teridentifikasi, nilai N-Gram (Uni-Gram, BiGram, Tri-Gram) akan dihitung untuk setiap suku kata dan dibandingkan dengan kamus Bahasa Indonesia. Setelah memperoleh nilai N-Gram, langkah selanjutnya adalah menghitung kedekatan atau jarak menggunakan Koefisien Sorensen-Dice (SDC). Langkah terakhir adalah mencari jarak terdekat ke suatu nilai konstan antara 0 dan 1, dengan kata yang memiliki nilai SDC tertinggi diasumsikan sebagai kata dasar, yang menunjukkan relevansi hasil.
Item Type: | Thesis (undergraduate) |
---|---|
Uncontrolled Keywords: | Information Retrieval, Stemming, Nazief dan Adriani, Sorensen Dice Coefficient |
Subjects: | Engineering > Informatics Engineering Engineering |
Divisions: | Faculty of Engineering > Informatics Engineering Study Program |
Depositing User: | Dwi Hasta Adhi Bhirawa |
Date Deposited: | 17 Feb 2024 17:34 |
Last Modified: | 17 Feb 2024 17:35 |
URI: | http://eprints.umg.ac.id/id/eprint/11348 |
Actions (login required)
View Item |