Untuk mengekstrak semua anotasi objek dari respons API di bidang Kecerdasan Buatan – Google Vision API – Pemahaman gambar tingkat lanjut – Deteksi objek, Anda dapat menggunakan format respons yang disediakan oleh API, yang mencakup daftar objek yang terdeteksi beserta korespondensinya kotak pembatas dan skor kepercayaan diri. Dengan menguraikan respons ini, Anda dapat mengekstrak anotasi objek yang diinginkan.
Respons API biasanya terdiri dari objek JSON yang berisi berbagai bidang, termasuk bidang "localizedObjectAnnotations", yang berisi objek yang terdeteksi. Setiap anotasi objek menyertakan informasi seperti nama objek, koordinat kotak pembatasnya, dan skor keyakinan yang menunjukkan keyakinan API dalam pendeteksian.
Untuk mengekstrak anotasi objek, Anda dapat mengikuti langkah-langkah berikut:
1. Mengurai respons API: Mulailah dengan mengurai respons JSON yang diterima dari API. Hal ini dapat dilakukan menggunakan pustaka penguraian JSON atau fungsi bawaan yang disediakan oleh bahasa pemrograman Anda.
2. Akses kolom "localizedObjectAnnotations": Setelah respons diurai, akses kolom "localizedObjectAnnotations", yang berisi objek yang terdeteksi. Bidang ini biasanya berupa array anotasi objek.
3. Iterasi melalui anotasi objek: Iterasi setiap anotasi objek dalam array. Setiap anotasi mewakili objek yang terdeteksi dalam gambar.
4. Ekstrak informasi yang relevan: Ekstrak informasi yang relevan dari setiap anotasi objek, seperti nama objek, koordinat kotak pembatas, dan skor keyakinan. Detail ini dapat diakses sebagai kolom terpisah dalam setiap anotasi objek.
5. Menyimpan atau memproses informasi yang diekstraksi: Tergantung pada kebutuhan Anda, Anda dapat menyimpan informasi yang diekstraksi dalam struktur data atau memprosesnya lebih lanjut untuk analisis atau tujuan lainnya. Misalnya, Anda mungkin ingin menyimpan nama objek dan koordinat kotak pembatasnya dalam database atau menggunakannya untuk tugas pemahaman gambar lebih lanjut.
Berikut ini contoh sederhana untuk menggambarkan proses ekstraksi:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"pertengahan": "/m/01g317",
"nama": "kucing",
"skor": 0.89271355,
"boundingPoly": {
"Vertikal yang dinormalisasi": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"pertengahan": "/m/04rky",
"nama": "anjing",
"skor": 0.8132468,
"boundingPoly": {
"Vertikal yang dinormalisasi": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Dalam contoh ini, kita mengasumsikan respons JSON berisi dua objek yang terdeteksi: kucing dan anjing. Kode mengurai respons, mengakses bidang "localizedObjectAnnotations", mengulangi setiap anotasi objek, dan mengekstrak nama objek, koordinat kotak pembatas, dan skor keyakinan. Terakhir, informasi yang diekstraksi akan dicetak, tetapi Anda dapat memodifikasi kodenya agar sesuai dengan kebutuhan spesifik Anda.
Dengan mengikuti langkah-langkah ini, Anda dapat secara efektif mengekstrak semua anotasi objek dari respons API di bidang Kecerdasan Buatan – Google Vision API – Pemahaman gambar tingkat lanjut – Deteksi objek.
Pertanyaan dan jawaban terbaru lainnya tentang Pemahaman gambar tingkat lanjut:
- Apa sajakah kategori yang telah ditentukan sebelumnya untuk pengenalan objek di Google Vision API?
- Pendekatan apa yang direkomendasikan untuk menggunakan fitur deteksi penelusuran aman yang dikombinasikan dengan teknik moderasi lainnya?
- Bagaimana kami dapat mengakses dan menampilkan nilai kemungkinan untuk setiap kategori dalam anotasi penelusuran aman?
- Bagaimana kita bisa mendapatkan anotasi penelusuran aman menggunakan Google Vision API dengan Python?
- Apa saja lima kategori yang termasuk dalam fitur deteksi pencarian aman?
- Bagaimana cara fitur penelusuran aman Google Vision API mendeteksi konten eksplisit dalam gambar?
- Bagaimana kita bisa mengidentifikasi dan menyorot objek yang terdeteksi secara visual dalam gambar menggunakan perpustakaan bantal?
- Bagaimana kita mengatur informasi objek yang diekstraksi dalam format tabel menggunakan bingkai data pandas?
- Pustaka dan bahasa pemrograman apa yang digunakan untuk mendemonstrasikan fungsi Google Vision API?
- Bagaimana cara Google Vision API melakukan deteksi dan pelokalan objek pada gambar?
Lihat lebih banyak pertanyaan dan jawaban di Pemahaman gambar tingkat lanjut