Untuk mengekstrak label dari gambar secara terprogram menggunakan Python dan Vision API, Anda dapat memanfaatkan kemampuan canggih dari Google Cloud Vision API. Vision API menyediakan serangkaian fitur analisis gambar yang komprehensif, termasuk deteksi label, yang memungkinkan Anda mengidentifikasi dan mengekstrak label dari gambar secara otomatis.
Untuk memulai, Anda perlu menyiapkan proyek Google Cloud dan mengaktifkan Vision API. Setelah Anda selesai melakukannya, Anda dapat menginstal pustaka Python yang diperlukan dengan menjalankan perintah berikut:
python pip install google-cloud-vision
Selanjutnya, Anda perlu mengautentikasi aplikasi Anda untuk mengakses Vision API. Anda dapat melakukannya dengan membuat kunci akun layanan dan menyetel variabel lingkungan `GOOGLE_APPLICATION_CREDENTIALS` agar mengarah ke jalur file kunci. Ini dapat dilakukan dengan menggunakan kode berikut:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Sekarang, Anda dapat menggunakan Vision API untuk mengekstrak label dari gambar secara terprogram. Cuplikan kode berikut menunjukkan cara melakukan ini:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
Dalam kode ini, pertama-tama kita membuat instance kelas `ImageAnnotatorClient` dari perpustakaan `google.cloud.vision`. Kami kemudian membaca file gambar, membuat objek `Gambar` dari konten file, dan mengirimkannya ke Vision API untuk deteksi label. Respons API berisi daftar anotasi label, yang darinya kami mengekstrak deskripsi label tersebut.
Anda sekarang dapat memanggil fungsi `extract_labels` dengan meneruskan jalur ke file gambar yang ingin Anda analisis. Ini akan mengembalikan daftar label yang diekstrak dari gambar.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Ini akan menampilkan label yang diekstraksi dari gambar.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API menggunakan model pembelajaran mesin tingkat lanjut untuk menganalisis gambar dan mengidentifikasi objek, pemandangan, dan fitur visual lainnya. Ini dapat mendeteksi berbagai label secara akurat, menjadikannya alat yang berharga untuk berbagai aplikasi seperti klasifikasi gambar, moderasi konten, dan pencarian visual.
Untuk mengekstrak label dari gambar secara terprogram menggunakan Python dan Vision API, Anda perlu menyiapkan proyek Google Cloud, mengaktifkan Vision API, menginstal pustaka Python yang diperlukan, mengautentikasi aplikasi Anda, lalu menggunakan Vision API untuk melakukan deteksi label pada gambar-gambar. Label yang diekstraksi dapat digunakan untuk analisis lebih lanjut atau untuk meningkatkan pemahaman tentang konten gambar.
Pertanyaan dan jawaban terbaru lainnya tentang EITC/AI/GVAPI Google Vision API:
- Apa sajakah kategori yang telah ditentukan sebelumnya untuk pengenalan objek di Google Vision API?
- Apakah Google Vision API mengaktifkan pengenalan wajah?
- Bagaimana teks tampilan dapat ditambahkan ke gambar saat menggambar batas objek menggunakan fungsi "draw_vertices"?
- Apa saja parameter metode "draw.line" dalam kode yang disediakan, dan bagaimana cara menggunakannya untuk menggambar garis antar nilai simpul?
- Bagaimana perpustakaan bantal dapat digunakan untuk menggambar batas objek dengan Python?
- Apa tujuan dari fungsi "draw_vertices" dalam kode yang disediakan?
- Bagaimana Google Vision API dapat membantu memahami bentuk dan objek dalam gambar?
- Bagaimana cara pengguna menjelajahi gambar serupa secara visual yang direkomendasikan oleh API?
- Apa saja elemen berbeda yang disediakan dalam objek respons fitur deteksi web Google Vision API?
- Bagaimana fitur Deteksi Web membantu menghasilkan tag untuk gambar yang diunggah?
Lihat pertanyaan dan jawaban lainnya di EITC/AI/GVAPI Google Vision API