Bagaimana Anda bisa mengakses teks yang diekstraksi dari gambar menggunakan Google Vision API?

by Akademi EITCA / Rabu, 27 Desember 2023 / Diterbitkan di Kecerdasan Buatan, EITC/AI/GVAPI Google Vision API, Memahami teks dalam data visual, Mendeteksi dan mengekstrak teks dari tulisan tangan, Ulasan pemeriksaan

Untuk mengakses teks yang diekstraksi dari gambar menggunakan Google Vision API, Anda dapat mengikuti serangkaian langkah yang melibatkan pemanfaatan kemampuan Optical Character Recognition (OCR) pada API. Teknologi OCR di Google Vision API memungkinkan deteksi dan ekstraksi teks dari gambar, termasuk tulisan tangan. Fungsionalitas ini sangat berguna dalam aplikasi yang memerlukan analisis dan pemahaman informasi tekstual yang ada dalam data visual.

Pertama, Anda perlu menyiapkan lingkungan yang diperlukan untuk bekerja dengan Google Vision API. Hal ini melibatkan pembuatan proyek di Google Cloud Console, mengaktifkan Vision API, dan memperoleh kredensial autentikasi yang diperlukan seperti kunci API atau kunci akun layanan.

Setelah lingkungan Anda diatur, Anda dapat menggunakan metode `asyncBatchAnnotateFiles` Vision API untuk melakukan OCR pada file gambar. Metode ini memungkinkan Anda meneruskan daftar file gambar untuk diproses dan menerima hasilnya secara asinkron. Alternatifnya, Anda dapat menggunakan metode `asyncBatchAnnotateImages` untuk memproses daftar gambar secara langsung.

Untuk mengekstrak teks dari gambar, Anda perlu membuat instance objek `AnnotateImageRequest` dan menentukan fitur yang diinginkan. Dalam hal ini, Anda akan menyetel fitur `TEXT_DETECTION` untuk menunjukkan bahwa Anda ingin mengekstrak teks dari gambar. Anda juga dapat menentukan parameter tambahan seperti petunjuk bahasa untuk meningkatkan akurasi OCR.

Selanjutnya, Anda perlu mengkodekan file gambar ke dalam string yang dikodekan base64 dan membuat instance objek `Gambar` menggunakan data gambar yang dikodekan. Objek `Image` ini harus ditambahkan ke objek `AnnotateImageRequest` yang dibuat sebelumnya.

Setelah menyiapkan permintaan, Anda dapat mengirimkannya ke Vision API menggunakan metode `batchAnnotateImages` atau `batchAnnotateFiles`, bergantung pada pendekatan yang Anda pilih. API akan memproses gambar dan mengembalikan respons yang berisi teks yang diekstraksi.

Untuk mengakses teks yang diekstraksi dari respons, Anda dapat melakukan iterasi pada kolom `textAnnotations` pada objek `AnnotateImageResponse`. Bidang ini berisi daftar objek `EntityAnnotation`, masing-masing mewakili elemen teks yang terdeteksi dalam gambar. Bidang `deskripsi` dari setiap objek `EntityAnnotation` berisi teks yang diekstrak.

Berikut ini contoh cuplikan kode dengan Python yang menunjukkan cara mengakses teks yang diekstrak dari gambar menggunakan Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

Dalam contoh ini, fungsi `extract_text_from_image` mengambil jalur ke file gambar sebagai masukan dan menggunakan pustaka klien Google Cloud Vision untuk mengirim permintaan ke Vision API. Teks yang diekstraksi kemudian dicetak.

Untuk mengakses teks yang diekstraksi dari gambar menggunakan Google Vision API, Anda perlu menyiapkan lingkungan, membuat objek `AnnotateImageRequest` dengan fitur yang diinginkan, menyandikan file gambar, mengirim permintaan ke API, dan mengambil teks yang diekstraksi dari responsnya. Kemampuan OCR dari Vision API memungkinkan deteksi dan ekstraksi teks dari gambar, termasuk tulisan tangan.

Pertanyaan dan jawaban terbaru lainnya tentang Mendeteksi dan mengekstrak teks dari tulisan tangan:

Lebih banyak pertanyaan dan jawaban:

Bidang: Kecerdasan Buatan
Program: EITC/AI/GVAPI Google Vision API (pergi ke program sertifikasi)
Pelajaran: Memahami teks dalam data visual (pergi ke pelajaran terkait)
Topik: Mendeteksi dan mengekstrak teks dari tulisan tangan (pergi ke topik terkait)
Ulasan pemeriksaan

Di bawah: Kecerdasan Buatan, API Google Cloud Vision, Pengolahan citra, OCR, Character Recognition optik, Ekstraksi Teks

Akademi EITCA

Bagaimana Anda bisa mengakses teks yang diekstraksi dari gambar menggunakan Google Vision API?

Pertanyaan dan jawaban terbaru lainnya tentang Mendeteksi dan mengekstrak teks dari tulisan tangan:

Lebih banyak pertanyaan dan jawaban:

Akademi EITCA adalah bagian dari kerangka kerja Sertifikasi TI Eropa

Kelayakan untuk EITCA Academy 80% dukungan Subsidi EITCI DSJC

Akademi EITCA

MASUK KE AKUN ANDA OLEH BAIK DENGAN USERNAME ATAU ALAMAT EMAIL ANDA

LUPA RINCIAN ANDA?

BUAT SEBUAH AKUN

Bagaimana Anda bisa mengakses teks yang diekstraksi dari gambar menggunakan Google Vision API?

Pertanyaan dan jawaban terbaru lainnya tentang Mendeteksi dan mengekstrak teks dari tulisan tangan:

Lebih banyak pertanyaan dan jawaban:

Kelayakan untuk EITCA Academy 80% dukungan Subsidi EITCI DSJC