Memanfaatkan model Gemini Pro Vision untuk memahami gambar, prompt multimodal, dan aksesibilitas

  1. Manakah dari model Gemini berikut yang mendukung perintah gambar?

  2. Apa arti error “[400 Bad Request] Modalitas input gambar tidak diaktifkan untuk model/gemini-pro” saat memanggil Gemini API?

  3. Model Gemini dapat memecahkan soal dasar berbasis geometri atau logika berdasarkan gambar: