Memahami lingkungan pengguna di Android NDK (C)

Pelajari cara menggunakan Scene Semantics API di aplikasi Anda sendiri.

Scene Semantics API memungkinkan developer memahami adegan di sekitar pengguna, dengan menyediakan informasi semantik real-time berbasis model ML. Dengan mempertimbangkan gambar suasana luar ruangan, API akan menampilkan label untuk setiap piksel pada sekumpulan kelas semantik yang berguna, seperti langit, bangunan, pohon, jalan, trotoar, kendaraan, orang, dan banyak lagi. Selain label piksel, Scene Semantics API juga menawarkan nilai keyakinan untuk setiap label piksel dan cara yang mudah digunakan untuk mengkueri prevalensi label tertentu dalam suasana luar ruangan.

Dari kiri ke kanan, contoh gambar input, gambar semantik label piksel, dan gambar keyakinan yang sesuai:

Contoh gambar input, gambar semantik, dan gambar keyakinan semantik.

Prasyarat

Pastikan Anda memahami konsep AR dasar dan cara mengonfigurasi sesi ARCore sebelum melanjutkan.

Mengaktifkan Semantik Scene

Dalam sesi ARCore baru, periksa apakah perangkat pengguna mendukung Scene Semantics API. Tidak semua perangkat yang kompatibel dengan ARCore mendukung Scene Semantics API karena keterbatasan daya pemrosesan.

Untuk menyimpan resource, Scene Semantics dinonaktifkan secara default di ARCore. Mengaktifkan mode semantik agar aplikasi Anda menggunakan Scene Semantics API.

// Check whether the user's device supports the Scene Semantics API.
int32_t is_scene_semantics_supported = 0;
ArSession_isSemanticModeSupported(ar_session, AR_SEMANTIC_MODE_ENABLED, &is_scene_semantics_supported);

// Configure the session for AR_SEMANTIC_MODEL_ENABLED.
ArConfig* ar_config = NULL;
ArConfig_create(ar_session, &ar_config);
if (is_scene_semantics_supported) {
  ArConfig_setSemanticMode(ar_session, ar_config, AR_SEMANTIC_MODE_ENABLED);
}
CHECK(ArSession_configure(ar_session, ar_config) == AR_SUCCESS);
ArConfig_destroy(ar_config);

Mendapatkan gambar semantik

Setelah Scene Semantics diaktifkan, gambar semantik dapat diambil. Gambar semantik adalah gambar AR_IMAGE_FORMAT_Y8, dengan setiap piksel sesuai dengan label semantik yang ditentukan oleh ArSemanticLabel.

Gunakan ArFrame_acquireSemanticImage() untuk memperoleh gambar semantik:

// Retrieve the semantic image for the current frame, if available.
ArImage* semantic_image = NULL;
if (ArFrame_acquireSemanticImage(ar_session, ar_frame, &semantic_image) != AR_SUCCESS) {
  // No semantic image retrieved for this frame.
  // The output image may be missing for the first couple frames before the model has had a chance to run yet.
  return;
}
// If a semantic image is available, use it here.

Gambar semantik output akan tersedia setelah sekitar 1-3 frame dari awal sesi, bergantung pada perangkat.

Mendapatkan gambar keyakinan

Selain gambar semantik, yang memberikan label untuk setiap piksel, API juga memberikan gambar keyakinan dari nilai keyakinan piksel yang sesuai. Gambar keyakinan adalah gambar AR_IMAGE_FORMAT_Y8, dengan setiap piksel sesuai dengan nilai dalam rentang [0, 255], yang sesuai dengan probabilitas yang terkait dengan label semantik untuk setiap piksel.

Gunakan ArFrame_acquireSemanticConfidenceImage() untuk mendapatkan gambar keyakinan semantik:

// Retrieve the semantic confidence image for the current frame, if available.
ArImage* semantic_confidence_image = NULL;
if (ArFrame_acquireSemanticConfidenceImage(ar_session, ar_frame, &semantic_confidence_image) != AR_SUCCESS) {
  // No semantic confidence image retrieved for this frame.
  // The output image may be missing for the first couple frames before the model has had a chance to run yet.
  return;
}
// If a semantic confidence image is available, use it here.

Gambar keyakinan output akan tersedia setelah sekitar 1-3 frame dari awal sesi, bergantung pada perangkat.

Mengkueri fraksi piksel untuk label semantik

Anda juga dapat mengkueri fraksi piksel dalam frame saat ini yang termasuk dalam class tertentu, seperti langit. Kueri ini lebih efisien daripada menampilkan gambar semantik dan melakukan penelusuran berdasarkan piksel untuk label tertentu. Fraksi yang ditampilkan adalah nilai float dalam rentang [0.0, 1.0].

Gunakan ArFrame_getSemanticLabelFraction() untuk memperoleh pecahan untuk label tertentu:

// Retrieve the fraction of pixels for the semantic label sky in the current frame.
float out_fraction = 0.0f;
if (ArFrame_getSemanticLabelFraction(ar_session, ar_frame, AR_SEMANTIC_LABEL_SKY, &out_fraction) != AR_SUCCESS) {
  // No fraction of semantic labels was retrieved for this frame.
}