Untuk mengakses teks yang diekstraksi dari gambar menggunakan Google Vision API, Anda dapat mengikuti serangkaian langkah yang melibatkan pemanfaatan kemampuan Optical Character Recognition (OCR) pada API. Teknologi OCR di Google Vision API memungkinkan deteksi dan ekstraksi teks dari gambar, termasuk tulisan tangan. Fungsionalitas ini sangat berguna dalam aplikasi yang memerlukan analisis dan pemahaman informasi tekstual yang ada dalam data visual.
Pertama, Anda perlu menyiapkan lingkungan yang diperlukan untuk bekerja dengan Google Vision API. Hal ini melibatkan pembuatan proyek di Google Cloud Console, mengaktifkan Vision API, dan memperoleh kredensial autentikasi yang diperlukan seperti kunci API atau kunci akun layanan.
Setelah lingkungan Anda diatur, Anda dapat menggunakan metode `asyncBatchAnnotateFiles` Vision API untuk melakukan OCR pada file gambar. Metode ini memungkinkan Anda meneruskan daftar file gambar untuk diproses dan menerima hasilnya secara asinkron. Alternatifnya, Anda dapat menggunakan metode `asyncBatchAnnotateImages` untuk memproses daftar gambar secara langsung.
Untuk mengekstrak teks dari gambar, Anda perlu membuat instance objek `AnnotateImageRequest` dan menentukan fitur yang diinginkan. Dalam hal ini, Anda akan menyetel fitur `TEXT_DETECTION` untuk menunjukkan bahwa Anda ingin mengekstrak teks dari gambar. Anda juga dapat menentukan parameter tambahan seperti petunjuk bahasa untuk meningkatkan akurasi OCR.
Selanjutnya, Anda perlu mengkodekan file gambar ke dalam string yang dikodekan base64 dan membuat instance objek `Gambar` menggunakan data gambar yang dikodekan. Objek `Image` ini harus ditambahkan ke objek `AnnotateImageRequest` yang dibuat sebelumnya.
Setelah menyiapkan permintaan, Anda dapat mengirimkannya ke Vision API menggunakan metode `batchAnnotateImages` atau `batchAnnotateFiles`, bergantung pada pendekatan yang Anda pilih. API akan memproses gambar dan mengembalikan respons yang berisi teks yang diekstraksi.
Untuk mengakses teks yang diekstraksi dari respons, Anda dapat melakukan iterasi pada kolom `textAnnotations` pada objek `AnnotateImageResponse`. Bidang ini berisi daftar objek `EntityAnnotation`, masing-masing mewakili elemen teks yang terdeteksi dalam gambar. Bidang `deskripsi` dari setiap objek `EntityAnnotation` berisi teks yang diekstrak.
Berikut ini contoh cuplikan kode dengan Python yang menunjukkan cara mengakses teks yang diekstrak dari gambar menggunakan Google Vision API:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
Dalam contoh ini, fungsi `extract_text_from_image` mengambil jalur ke file gambar sebagai masukan dan menggunakan pustaka klien Google Cloud Vision untuk mengirim permintaan ke Vision API. Teks yang diekstraksi kemudian dicetak.
Untuk mengakses teks yang diekstraksi dari gambar menggunakan Google Vision API, Anda perlu menyiapkan lingkungan, membuat objek `AnnotateImageRequest` dengan fitur yang diinginkan, menyandikan file gambar, mengirim permintaan ke API, dan mengambil teks yang diekstraksi dari responsnya. Kemampuan OCR dari Vision API memungkinkan deteksi dan ekstraksi teks dari gambar, termasuk tulisan tangan.
Pertanyaan dan jawaban terbaru lainnya tentang Mendeteksi dan mengekstrak teks dari tulisan tangan:
- Batasan apa yang mungkin timbul saat mengekstraksi teks dari dokumen kompleks menggunakan Google Vision API?
- Apa pentingnya tingkat kepercayaan dalam interpretasi teks Google Vision API?
- Bagaimana Google Vision API dapat mengenali dan mengekstrak teks dari catatan tulisan tangan secara akurat?
- Apa saja tantangan dalam mendeteksi dan mengekstraksi teks dari gambar tulisan tangan?
- Bisakah Google Vision mengenali tulisan tangan?