Implementation Of The Nazief & Adriani Method Using N-Gram And Sørensen-Dice Coefficient In Typography Error Checking For Indonesian

Bhirawa, Dwi Hasta Adhi (2019) Implementation Of The Nazief & Adriani Method Using N-Gram And Sørensen-Dice Coefficient In Typography Error Checking For Indonesian. undergraduate thesis, Universitas Muhammadiyah Gresik.

[img] Text
2019_TA_TIF_14622030_Lembar Keaslian.pdf

Download (224kB)
[img] Text
2019_TA_TIF_14622030_Lembar Pengesahan.pdf

Download (253kB)
[img] Text
2019_TA_TIF_14622030_Lembar Persetujuan Skripsi.pdf

Download (167kB)
[img] Text
2019_TA_TIF_14622030_Lembar Persetujuan Publikasi.pdf

Download (246kB)
[img] Text
2019_TA_TIF_14622030_Halaman Judul.pdf

Download (2MB)
[img]
Preview
Text
2019_TA_TIF_14622030_Bab 1.pdf

Download (2MB) | Preview
[img]
Preview
Text
2019_TA_TIF_14622030_Bab 2.pdf

Download (4MB) | Preview
[img]
Preview
Text
2019_TA_TIF_14622030_Bab 3.pdf

Download (10MB) | Preview
[img] Text
2019_TA_TIF_14622030_Bab 4.pdf
Restricted to Repository staff only

Download (5MB) | Request a copy
[img]
Preview
Text
2019_TA_TIF_14622030_Bab 5.pdf

Download (1MB) | Preview
[img] Text
2019_TA_TIF_14622030_Lampiran.pdf

Download (655kB)
[img] Text
Daftar Pustaka.pdf

Download (142kB)

Abstract

Information Retrieval adalah studi tentang bagaimana data dapat ditemukan dari berbagai sumber atau kumpulan informasi relevan yang sedang dicari atau dibutuhkan. Ini melibatkan tindakan seperti pengindeksan, pencarian, dan pemanggilan kembali data, yang juga dikenal sebagai information retrieval. Data dapat mencakup teks, tabel, gambar, video, dan audio. Dalam Information Retrieval, preprocessing merupakan langkah penting, karena mengubah data input menjadi format yang sesuai dan siap untuk diproses. Metode stemming menggunakan algoritma Nazief & Adriani mematuhi kaidah morfologi bahasa Indonesia, mengklasifikasikan afiks ke dalam kategori seperti afiks yang diizinkan atau tidak diizinkan. Klasifikasi ini mencakup prefiks, sufiks, infiks, dan kombinasi afiks di awal dan akhir kata dasar (misalnya, dalam "membenarkan," yang mencakup afiks -me dan -kan yang diterapkan pada kata dasar "benar"). Penelitian ini akan difokuskan pada stemming kata-kata berafiks menggunakan metode Nazief & Adriani yang dikombinasikan dengan metode N-Gram dan Sorensen Dice Coefficient. Dalam pendekatan ini, untuk setiap kata yang kata dasarnya atau bentuk dasarnya tidak teridentifikasi, nilai N-Gram (Uni-Gram, BiGram, Tri-Gram) akan dihitung untuk setiap suku kata dan dibandingkan dengan kamus Bahasa Indonesia. Setelah memperoleh nilai N-Gram, langkah selanjutnya adalah menghitung kedekatan atau jarak menggunakan Koefisien Sorensen-Dice (SDC). Langkah terakhir adalah mencari jarak terdekat ke suatu nilai konstan antara 0 dan 1, dengan kata yang memiliki nilai SDC tertinggi diasumsikan sebagai kata dasar, yang menunjukkan relevansi hasil.

Item Type: Thesis (undergraduate)
Uncontrolled Keywords: Information Retrieval, Stemming, Nazief dan Adriani, Sorensen Dice Coefficient
Subjects: Engineering > Informatics Engineering
Engineering
Divisions: Faculty of Engineering > Informatics Engineering Study Program
Depositing User: Dwi Hasta Adhi Bhirawa
Date Deposited: 17 Feb 2024 17:34
Last Modified: 17 Feb 2024 17:35
URI: http://eprints.umg.ac.id/id/eprint/11348

Actions (login required)

View Item View Item