Google Vision API adalah alat pemahaman gambar canggih yang memungkinkan pengembang mengintegrasikan kemampuan pengenalan gambar yang canggih ke dalam aplikasi mereka. Ini menyediakan berbagai fitur, termasuk deteksi objek, pengenalan wajah, ekstraksi teks, dan banyak lagi. Untuk mendemonstrasikan fungsi Google Vision API, pengembang dapat memanfaatkan berbagai perpustakaan dan bahasa pemrograman.
Salah satu bahasa pemrograman populer yang digunakan untuk berinteraksi dengan Google Vision API adalah Python. Python dikenal luas karena kesederhanaannya, keterbacaannya, dan dukungan perpustakaannya yang luas, menjadikannya pilihan ideal bagi pengembang. Untuk mengakses Google Vision API menggunakan Python, pengembang dapat memanfaatkan Perpustakaan Klien Google Cloud resmi untuk Python. Pustaka ini menyediakan sekumpulan API tingkat tinggi yang menyederhanakan proses interaksi dengan API, sehingga memudahkan dalam melakukan tugas seperti mengunggah gambar, membuat permintaan API, dan mengambil hasilnya.
Berikut ini contoh cara menggunakan Pustaka Klien Google Cloud untuk Python guna mendemonstrasikan fungsi Google Vision API:
python from google.cloud import vision # Instantiates a client client = vision.ImageAnnotatorClient() # The name of the image file to annotate file_name = 'path/to/image.jpg' # Loads the image into memory with open(file_name, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) # Performs object detection on the image response = client.object_localization(image=image) objects = response.localized_object_annotations # Prints the detected objects for object_ in objects: print(f'{object_.name} (confidence: {object_.score})')
Dalam contoh ini, pertama-tama kita mengimpor modul yang diperlukan dari Perpustakaan Klien Google Cloud untuk Python. Kami kemudian membuat instance objek klien yang akan digunakan untuk membuat permintaan API. Selanjutnya, kita tentukan file gambar yang ingin kita beri anotasi dan memuatnya ke dalam memori. Terakhir, kami membuat permintaan API untuk deteksi objek dan mengambil objek yang terdeteksi beserta skor keyakinannya.
Selain Python, bahasa pemrograman lain seperti Java, Node.js, dan Go juga dapat digunakan untuk berinteraksi dengan Google Vision API. Google juga menyediakan perpustakaan klien untuk bahasa-bahasa ini, sehingga memudahkan pengembang untuk mengintegrasikan API ke dalam aplikasi mereka.
Untuk mendemonstrasikan fungsi Google Vision API, pengembang dapat menggunakan berbagai perpustakaan dan bahasa pemrograman. Python, dengan Google Cloud Client Library untuk Python, adalah pilihan populer karena kesederhanaannya dan dukungan perpustakaan yang luas. Namun, bahasa lain seperti Java, Node.js, dan Go juga didukung oleh perpustakaan klien Google.
Pertanyaan dan jawaban terbaru lainnya tentang Pemahaman gambar tingkat lanjut:
- Apa sajakah kategori yang telah ditentukan sebelumnya untuk pengenalan objek di Google Vision API?
- Pendekatan apa yang direkomendasikan untuk menggunakan fitur deteksi penelusuran aman yang dikombinasikan dengan teknik moderasi lainnya?
- Bagaimana kami dapat mengakses dan menampilkan nilai kemungkinan untuk setiap kategori dalam anotasi penelusuran aman?
- Bagaimana kita bisa mendapatkan anotasi penelusuran aman menggunakan Google Vision API dengan Python?
- Apa saja lima kategori yang termasuk dalam fitur deteksi pencarian aman?
- Bagaimana cara fitur penelusuran aman Google Vision API mendeteksi konten eksplisit dalam gambar?
- Bagaimana kita bisa mengidentifikasi dan menyorot objek yang terdeteksi secara visual dalam gambar menggunakan perpustakaan bantal?
- Bagaimana kita mengatur informasi objek yang diekstraksi dalam format tabel menggunakan bingkai data pandas?
- Bagaimana kita mengekstrak semua anotasi objek dari respons API?
- Bagaimana cara Google Vision API melakukan deteksi dan pelokalan objek pada gambar?
Lihat lebih banyak pertanyaan dan jawaban di Pemahaman gambar tingkat lanjut