Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras
Pengecaman tulisan tangan teks Jawi adalah satu tugas yang sangat mencabar di dalam bidang Pengecaman Aksara Optik (PAO) disebabkan Jawi adalah satu tulisan jenis bersambung. Tesis ini mengenegahkan teknik untuk memperbaiki kadar pengecaman teks Jawi tulisan tangan. Skema barn yang lebih cekap un...
Saved in:
Main Author: | |
---|---|
Format: | Thesis |
Language: | English Malay |
Published: |
2000
|
Subjects: | |
Online Access: | http://psasir.upm.edu.my/id/eprint/9645/1/FSKTM_2000_1_IR.pdf |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
my-upm-ir.9645 |
---|---|
record_format |
uketd_dc |
spelling |
my-upm-ir.96452023-11-29T02:09:10Z Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras 2000-04 Omar, Khairuddin Pengecaman tulisan tangan teks Jawi adalah satu tugas yang sangat mencabar di dalam bidang Pengecaman Aksara Optik (PAO) disebabkan Jawi adalah satu tulisan jenis bersambung. Tesis ini mengenegahkan teknik untuk memperbaiki kadar pengecaman teks Jawi tulisan tangan. Skema barn yang lebih cekap untuk prapemprosesan, penemberengan, penyarian fitur dan pemonnalan aksara, dan pengkelasan telah direka untuk memenuhi objektif tersebut. Dntuk prapemprosesan, kaedah pembetulan pencongan dan erotan menggunakan kaedah histogram orientasi cerunan (HOC) yang asalnya digunakan untuk dokumen Latin telah dimasukkan sebagai satu daripada modul prapemprosesan. Satu skema barn untuk penemberengan telah diperkenalkan. Ia berasaskan kepada gabungan kaedah unjuran profail histogram dan penentuan titik tembereng ubah suai (PIT) membentuk kaedah penentuan titik tembereng (PTT). Fitur-fitur disarikan daripada aksara yang telah ditemberengkan menggunakan tiga jenis fitur. Fitur-fitur ini ialah struktur, fitur Momen Tak-berubah (MTB) dan Taburan Pilrsel Hitam (TPH). Algoritma penyingkiran bahagian sekunder aksara Jawi (seperti titik-titik, A" " dan maddah) juga telah diperkenalkan supaya dapat mengelakkan daripada salah cam sekunder ini.Ia perlu dipisahkan terlebih dahulu sebelum melalui proses p'engecaman. Hal ini dapat mengurangkan bilangan kelas aksara Jawi daripada 124 kepada 60. Sebanyak 200 sampel setiap kelas aksara Jawi telah diujikan untuk tujuan pengkelasan. Dua aras sistem pengkelasan terdiri daripada Pengkelas Kumpulan berasaskan Ukuran Keserupaan (PKUK) dan Pengkelas berganda Genetik-Perambat-balik (PGPB). Di aras pertama, PKUK menggunakan fitur struktur dan MTB untuk mengelompokkan kesemua aksara. Tujuh jenis primitif diperoleh menggunakan fitur struktur, dan proses pengelompokan berdasarkan kepada jenis primitif ini. Fitur MTB digunakan untuk mengirakan ukuran keserupaan dan kemudian menentukan kadar pengkelasan untuk setiap kumpulan. Setelah kesemua sampel aksara telah dikelompokkan, PGPB digunakan untuk mengkelaskan setiap aksara dalam kumpulan masing-masing dan dilarikan secara berasingan. Kelas aksara yang terbanyak ialah 14 aksara. Di aras kedua, PGPB dilaksanakan dalam dua peringkat iaitu peringkat pembelajaran, dan peringkat ujian. Di peringkat pembelajaran, pengkelasan ini menggunakan fitur MTB dan TPH, manakala di peringkat ujian pengkelas ini menggunakan maklumat tambahan iaitu maklumat yang diperoleh ketika menyingkirkan juzuk sekunder, dan di samping fitur MTB serta TPH. Pemecahan masalah ini kepada dua aras telah mengurangkan masa pembelajaran yang diambil oleh pengkelas dan beIjaya menambah kadar pengecaman. Tesis ini membicarakan secara terperinci setiap algoritma dan prestasinya terhadap sampel yang digunakan didalam ujikaji. Perbandingan juga dibuat terhadap kaedah pengawalan pemberat PB menggunakan pendekatan Sifar, Rawak, serta Rawak Nguyen-Widrow, di samping pendekatan ubah suai AG. Prestasi menggunakan AG (ubah suai) memberikan hasil pengkelasan yang dijanjikan. Jawi alphabet - Technology innovation 2000-04 Thesis http://psasir.upm.edu.my/id/eprint/9645/ http://psasir.upm.edu.my/id/eprint/9645/1/FSKTM_2000_1_IR.pdf text en public doctoral Universiti Putra Malaysia Jawi alphabet - Technology innovation Faculty of Computer Science and Information Technology Mahmod, Ramlan Malay |
institution |
Universiti Putra Malaysia |
collection |
PSAS Institutional Repository |
language |
English Malay |
advisor |
Mahmod, Ramlan |
topic |
Jawi alphabet - Technology innovation |
spellingShingle |
Jawi alphabet - Technology innovation Omar, Khairuddin Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras |
description |
Pengecaman tulisan tangan teks Jawi adalah satu tugas yang sangat mencabar
di dalam bidang Pengecaman Aksara Optik (PAO) disebabkan Jawi adalah satu
tulisan jenis bersambung. Tesis ini mengenegahkan teknik untuk memperbaiki kadar
pengecaman teks Jawi tulisan tangan. Skema barn yang lebih cekap untuk
prapemprosesan, penemberengan, penyarian fitur dan pemonnalan aksara, dan
pengkelasan telah direka untuk memenuhi objektif tersebut. Dntuk prapemprosesan,
kaedah pembetulan pencongan dan erotan menggunakan kaedah histogram orientasi
cerunan (HOC) yang asalnya digunakan untuk dokumen Latin telah dimasukkan
sebagai satu daripada modul prapemprosesan. Satu skema barn untuk
penemberengan telah diperkenalkan. Ia berasaskan kepada gabungan kaedah unjuran
profail histogram dan penentuan titik tembereng ubah suai (PIT) membentuk
kaedah penentuan titik tembereng (PTT). Fitur-fitur disarikan daripada aksara yang
telah ditemberengkan menggunakan tiga jenis fitur. Fitur-fitur ini ialah struktur,
fitur Momen Tak-berubah (MTB) dan Taburan Pilrsel Hitam (TPH). Algoritma
penyingkiran bahagian sekunder aksara Jawi (seperti titik-titik, A" " dan maddah)
juga telah diperkenalkan supaya dapat mengelakkan daripada salah cam sekunder ini.Ia perlu dipisahkan terlebih dahulu sebelum melalui proses p'engecaman. Hal ini
dapat mengurangkan bilangan kelas aksara Jawi daripada 124 kepada 60. Sebanyak
200 sampel setiap kelas aksara Jawi telah diujikan untuk tujuan pengkelasan. Dua
aras sistem pengkelasan terdiri daripada Pengkelas Kumpulan berasaskan Ukuran
Keserupaan (PKUK) dan Pengkelas berganda Genetik-Perambat-balik (PGPB). Di
aras pertama, PKUK menggunakan fitur struktur dan MTB untuk mengelompokkan
kesemua aksara. Tujuh jenis primitif diperoleh menggunakan fitur struktur, dan
proses pengelompokan berdasarkan kepada jenis primitif ini. Fitur MTB digunakan
untuk mengirakan ukuran keserupaan dan kemudian menentukan kadar pengkelasan
untuk setiap kumpulan. Setelah kesemua sampel aksara telah dikelompokkan, PGPB
digunakan untuk mengkelaskan setiap aksara dalam kumpulan masing-masing dan
dilarikan secara berasingan. Kelas aksara yang terbanyak ialah 14 aksara. Di aras
kedua, PGPB dilaksanakan dalam dua peringkat iaitu peringkat pembelajaran, dan
peringkat ujian. Di peringkat pembelajaran, pengkelasan ini menggunakan fitur MTB
dan TPH, manakala di peringkat ujian pengkelas ini menggunakan maklumat
tambahan iaitu maklumat yang diperoleh ketika menyingkirkan juzuk sekunder, dan
di samping fitur MTB serta TPH. Pemecahan masalah ini kepada dua aras telah
mengurangkan masa pembelajaran yang diambil oleh pengkelas dan beIjaya
menambah kadar pengecaman. Tesis ini membicarakan secara terperinci setiap
algoritma dan prestasinya terhadap sampel yang digunakan didalam ujikaji.
Perbandingan juga dibuat terhadap kaedah pengawalan pemberat PB menggunakan
pendekatan Sifar, Rawak, serta Rawak Nguyen-Widrow, di samping pendekatan
ubah suai AG. Prestasi menggunakan AG (ubah suai) memberikan hasil pengkelasan
yang dijanjikan. |
format |
Thesis |
qualification_level |
Doctorate |
author |
Omar, Khairuddin |
author_facet |
Omar, Khairuddin |
author_sort |
Omar, Khairuddin |
title |
Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras |
title_short |
Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras |
title_full |
Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras |
title_fullStr |
Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras |
title_full_unstemmed |
Pengecaman Tulisan Tangan Teksjawi Menggunakan Pengkelas Multiaras |
title_sort |
pengecaman tulisan tangan teksjawi menggunakan pengkelas multiaras |
granting_institution |
Universiti Putra Malaysia |
granting_department |
Faculty of Computer Science and Information Technology |
publishDate |
2000 |
url |
http://psasir.upm.edu.my/id/eprint/9645/1/FSKTM_2000_1_IR.pdf |
_version_ |
1794018872330813440 |