Official StoreTekan tombol di atas untuk membeli semua alat dan bahan eksperimen di web ini

Aplikasi OCR (Optical Character Recognition) dengan Tesseract

OCR adalah salah satu metode untuk mengambil teks dari sebuah gambar. Anda tahu CAPTCHA? Dengan teknik OCR, CAPTCHA dapat dipecahkan secara programmatical. Anda ingin mengambil teks dari sebuah file PDF? OCR juga dapat melakukannya. Implementasi OCR dalam dunia elektro salah satunya adalah untuk pembacaan nomor plat kendaraan secara otomatis dan pembacaan meter (kwhmeter, PAM-meter, speedometer, dll). Dengan metode OCR ini, penggunaan sensor analog menjadi tidak relevan karena sudah tergantikan dengan  sebuah pengambil gambar bernama kamera. Keunggulan penggunaan metode ini adalah antara sistem pembacaan dan sistem yang dibaca bersifat non invasive (tidak bersentuhan langsung) sehingga tidak ada rugi-rugi (loss) yang ditimbulkan oleh sistem pembacaan data.

Dari sisi software yang digunakan ada banyak pilihan yang bisa digunakan. Namun kali ini saya akan menggunakan salah satu software open source yang diklaim terbaik dalam dunia OCR, yakni Tesseract. Tesseract ini dapat Anda unduh di https://code.google.com/p/tesseract-ocr/downloads/list. Saya sarankan untuk mengunduh file  tesseract-ocr-setup-3.02.02.exe. File ini bersifat installer yang akan memudahkan Anda untuk menginstal tesseract dan file-file pendukungnya. Jika sudah selesai mengunduh, double click file installer tersebut dan ikuti proses instalasinya hingga selesai. Jika instalasi Anda berhasil, maka akan tercipta subfolder ‘Tesseract-OCR’ dalam  folder C:/Program files. Di dalamnya sudah termasuk file-file library yang dibutuhkan tesseract untuk menerjemahkan gambar menjadi sebuah teks.

Penggunaan Tesseract ini juga cukup mudah, yakni berbasis command prompt. Jadi bagi penggemar bahasa pemrograman apapun (Delphi, VB, PHP, dll) dapat memanfaatkannya dengan mudah. Kali ini saya akan coba member contoh betapa mudahnya mengambil teks dari sebuah file gambar entah itu JPG, JPEG atau TIFF (direkomendasikan berformat TIFF untuk akurasi pembacaan karakter yang lebih tepat). Buka folder C:\Program Files\Tesseract-OCR\doc. Copy file ‘phototest.tiff’ dari folder tadi ke folder yang ada file tesseract.exe-nya, yakni di folder C:\Program Files\Tesseract-OCR. Kemudian eksekusi file tesseract.exe tersebut melalui DOS prompt atau cara termudah lewat START | ALL PROGRAM | Tesseract-OCR | Console, hingga muncul jendela command prompt sebagai berikut : tesseract console

Kemudian ketikkan command line sebagai berikut : tesseract phototest.tif hasil. Command ‘tesseract’ untuk menjalanka fungsi OCR, parameter ‘phototest.tif’ adalah gambar yang akan diambil karakter tulisannya (bisa diganti dengan file gambar lain), dan parameter ‘hasil’ adalah hasil penerjemahan file gambar phototest.tiff dalam bentuk file text dengan nama file ‘hasil.txt’. File ini berada satu folder dengan tesseract.exe di folder C:\Program Files\Tesseract-OCR. Sangat mudah bukan?

Jika Anda sudah berhasil melakukan penerjemahan file gambar menjadi teks, tentunya akan semakin merangsang kreasi Anda untuk mengembangkannya menjadi implementatif seperti pembacaan nomor plat kendaraan. Jika Anda ingin melakukannya Anda akan butuh bahasa pemrograman semacam Delphi atau PHP atau Java untuk mem-bundling tesseract ini dalam sebuah aplikasi yang cantik.  Tantangan sebenarnya adalah bagaimana menghasilkan  gambar yang ‘clear’ sebelum diterjemahkan oleh tesseract. Cara termudah adalah menggunakan aplikasi picture editor semacam GIMP atau photoshop. Anda tinggal mengubahnya menjadi format binary (Black and White), mengatur threshold-nya atau mengubah inversi colour-nya, agar mudah diterjemahkan tesseract. Jika Anda bermaksud mengaturnya dalam satu sistem yang berjalan otomatis tentu tidak mengkin menggunakan GIMP atau Photoshop. Anda bisa menggunakan aplikasi picture editor gratis lainnya yang berbasis command line seperti ImmageMagict atau Leptonica. Selamat berkreasi !

Nikmati artikel dan tutorial teknologi berkualitas hanya di saptaji.com. Artikel sebelumnya dapat Anda baca di http://saptaji.com/2014/05/05/5-menit-handling-detektor-tegangan-pln-220-vac-dengan-arduino/

Incoming search terms:

tesseract ocr delphi, fungsi tesseract, membuat ocr delphi, contoh aplikasi OCR, Pengertian tesseract, membuat ocr vb, cara mendeteksi plat nomor dengan arduino, contoh software aplikasi ocr, aplikasi yg digunakan ocr, termasuk aplikasi apakah OCR
7 Comments

Add a Comment

Your email address will not be published. Required fields are marked *

error: Content is protected !!