Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Android용 ML Kit를 사용한 주제 세분화

ML Kit를 사용하여 앱에 주체 분할 기능을 손쉽게 추가하세요.

기능	세부정보
SDK 이름	play-services-mlkit-subject-segmentation
구현	번들 해제됨: 모델은 Google Play 서비스를 사용하여 동적으로 다운로드됩니다.
앱 크기 영향	크기가 약 200KB 증가합니다.
초기화 시간	사용자는 처음 사용하기 전에 모델이 다운로드될 때까지 기다려야 할 수 있습니다.

사용해 보기

샘플 앱을 사용해 보고 이 API의 사용 예를 확인하세요.

시작하기 전에

이 API에는 Android API 수준 24 이상이 필요합니다. 앱의 빌드 파일이 minSdkVersion 값으로 24 이상을 사용하는지 확인하세요.

프로젝트 수준 build.gradle 파일의 buildscript 및 allprojects 섹션에 Google의 Maven 저장소가 포함되어야 합니다.
모듈의 앱 수준 Gradle 파일(일반적으로 app/build.gradle)에 ML Kit 주체 분할 라이브러리의 종속 항목을 추가합니다.

dependencies {
   implementation 'com.google.android.gms:play-services-mlkit-subject-segmentation:16.0.0-beta1'
}

위에서 언급한 바와 같이 모델은 Google Play 서비스에서 제공합니다. 앱이 Play 스토어에서 설치된 후 모델이 기기에 자동으로 다운로드되도록 앱을 구성할 수 있습니다. 이렇게 하려면 앱의 AndroidManifest.xml 파일에 다음 선언을 추가하세요.

<application ...>
      ...
      <meta-data
          android:name="com.google.mlkit.vision.DEPENDENCIES"
          android:value="subject_segment" >
      <!-- To use multiple models: android:value="subject_segment,model2,model3" -->
</application>

ModuleInstallClient API를 사용하여 Google Play 서비스를 통해 모델 가용성을 명시적으로 확인하고 다운로드를 요청할 수도 있습니다.

설치 시 모델 다운로드를 사용 설정하지 않거나 명시적 다운로드를 요청하지 않으면 분할기를 처음 실행할 때 모델이 다운로드됩니다. 다운로드가 완료되기 전에 요청하면 결과가 생성되지 않습니다.

1. 입력 이미지 준비

이미지에서 분할을 실행하려면 Bitmap, media.Image, ByteBuffer, 바이트 배열 또는 기기의 파일에서 InputImage 객체를 만듭니다.

아래에 설명된 대로 다양한 소스에서 InputImage 객체를 만들 수 있습니다.

`media.Image` 사용

기기의 카메라에서 이미지를 캡처할 때와 같이 media.Image 객체에서 InputImage 객체를 만들려면 media.Image 객체와 이미지의 회전을 InputImage.fromMediaImage()에 전달합니다.

CameraX 라이브러리를 사용하는 경우 OnImageCapturedListener 및 ImageAnalysis.Analyzer 클래스가 회전 값을 계산합니다.

Kotlin

private class YourImageAnalyzer : ImageAnalysis.Analyzer {

    override fun analyze(imageProxy: ImageProxy) {
        val mediaImage = imageProxy.image
        if (mediaImage != null) {
            val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees)
            // Pass image to an ML Kit Vision API
            // ...
        }
    }
}

Java

private class YourAnalyzer implements ImageAnalysis.Analyzer {

    @Override
    public void analyze(ImageProxy imageProxy) {
        Image mediaImage = imageProxy.getImage();
        if (mediaImage != null) {
          InputImage image =
                InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees());
          // Pass image to an ML Kit Vision API
          // ...
        }
    }
}

이미지의 회전 각도를 제공하는 카메라 라이브러리를 사용하지 않는 경우 기기의 회전 각도와 기기의 카메라 센서 방향에서 회전 각도를 계산할 수 있습니다.

Kotlin

private val ORIENTATIONS = SparseIntArray()

init {
    ORIENTATIONS.append(Surface.ROTATION_0, 0)
    ORIENTATIONS.append(Surface.ROTATION_90, 90)
    ORIENTATIONS.append(Surface.ROTATION_180, 180)
    ORIENTATIONS.append(Surface.ROTATION_270, 270)
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
@Throws(CameraAccessException::class)
private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    val deviceRotation = activity.windowManager.defaultDisplay.rotation
    var rotationCompensation = ORIENTATIONS.get(deviceRotation)

    // Get the device's sensor orientation.
    val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager
    val sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION)!!

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360
    }
    return rotationCompensation
}MLKitVisionImage.kt

Java

private static final SparseIntArray ORIENTATIONS = new SparseIntArray();
static {
    ORIENTATIONS.append(Surface.ROTATION_0, 0);
    ORIENTATIONS.append(Surface.ROTATION_90, 90);
    ORIENTATIONS.append(Surface.ROTATION_180, 180);
    ORIENTATIONS.append(Surface.ROTATION_270, 270);
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing)
        throws CameraAccessException {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation();
    int rotationCompensation = ORIENTATIONS.get(deviceRotation);

    // Get the device's sensor orientation.
    CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE);
    int sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION);

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360;
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360;
    }
    return rotationCompensation;
}

그런 다음 media.Image 객체와 회전 각도 값을 InputImage.fromMediaImage()에 전달합니다.

Kotlin

val image = InputImage.fromMediaImage(mediaImage, rotation)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromMediaImage(mediaImage, rotation);

파일 URI 사용

파일 URI에서 InputImage 객체를 만들려면 앱 컨텍스트 및 파일 URI를 InputImage.fromFilePath()에 전달합니다. `ACTION_GET_CONTENT` 인텐트를 사용하여 사용자에게 갤러리 앱에서 이미지를 선택하라는 메시지를 표시할 때 유용한 방법입니다.ACTION_GET_CONTENT

Kotlin

val image: InputImage
try {
    image = InputImage.fromFilePath(context, uri)
} catch (e: IOException) {
    e.printStackTrace()
}MLKitVisionImage.kt

Java

InputImage image;
try {
    image = InputImage.fromFilePath(context, uri);
} catch (IOException e) {
    e.printStackTrace();
}

`ByteBuffer` 또는 `ByteArray` 사용

InputImage 에서 ByteBuffer 또는 ByteArray 객체를 만들려면 먼저 media.Image 입력에 대해 앞에서 설명한 대로 이미지 회전 각도를 계산합니다. 그런 다음 이미지의 높이, 너비, 색상 인코딩 형식, 회전 각도와 함께 버퍼 또는 배열을 사용하여 InputImage 객체를 만듭니다.

Kotlin

val image = InputImage.fromByteBuffer(
        byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)MLKitVisionImage.kt
// Or:
val image = InputImage.fromByteArray(
        byteArray,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)
MLKitVisionImage.kt

Java

InputImage image = InputImage.fromByteBuffer(byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java
// Or:
InputImage image = InputImage.fromByteArray(
        byteArray,
        /* image width */480,
        /* image height */360,
        rotation,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java

`Bitmap` 사용

Bitmap 객체에서 InputImage 객체를 만들려면 다음 선언을 합니다.

Kotlin

val image = InputImage.fromBitmap(bitmap, 0)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);MLKitVisionImage.java

이미지는 회전 각도와 함께 Bitmap 객체로 표시됩니다.

2. SubjectSegmenter 인스턴스 만들기

분할기 옵션 정의

이미지를 분할하려면 먼저 다음과 같이 SubjectSegmenterOptions 인스턴스를 만듭니다.

Kotlin

val options = SubjectSegmenterOptions.Builder()
       // enable options
       .build()

Java

SubjectSegmenterOptions options = new SubjectSegmenterOptions.Builder()
        // enable options
        .build();

각 옵션의 세부정보는 다음과 같습니다.

전경 신뢰도 마스크

전경 신뢰도 마스크를 사용하면 전경 주체를 배경과 구분할 수 있습니다.

옵션에서 enableForegroundConfidenceMask()를 호출하면 나중에 이미지를 처리한 후 반환된 SubjectSegmentationResult 객체에서 getForegroundMask()를 호출하여 전경 마스크를 가져올 수 있습니다.

Kotlin

val options = SubjectSegmenterOptions.Builder()
        .enableForegroundConfidenceMask()
        .build()

Java

SubjectSegmenterOptions options = new SubjectSegmenterOptions.Builder()
        .enableForegroundConfidenceMask()
        .build();

전경 비트맵

마찬가지로 전경 주체의 비트맵을 가져올 수도 있습니다.

옵션에서 enableForegroundBitmap()을 호출하면 나중에 이미지를 처리한 후 반환된 SubjectSegmentationResult 객체에서 getForegroundBitmap()을 호출하여 전경 비트맵을 가져올 수 있습니다.

Kotlin

val options = SubjectSegmenterOptions.Builder()
        .enableForegroundBitmap()
        .build()

Java

SubjectSegmenterOptions options = new SubjectSegmenterOptions.Builder()
        .enableForegroundBitmap()
        .build();

다중 주체 신뢰도 마스크

전경 옵션과 마찬가지로 SubjectResultOptions를 사용하여 다음과 같이 각 전경 주체의 신뢰도 마스크를 사용 설정할 수 있습니다.

Kotlin

val subjectResultOptions = SubjectSegmenterOptions.SubjectResultOptions.Builder()
    .enableConfidenceMask()
    .build()

val options = SubjectSegmenterOptions.Builder()
    .enableMultipleSubjects(subjectResultOptions)
    .build()

Java

SubjectResultOptions subjectResultOptions =
        new SubjectSegmenterOptions.SubjectResultOptions.Builder()
            .enableConfidenceMask()
            .build()

SubjectSegmenterOptions options = new SubjectSegmenterOptions.Builder()
      .enableMultipleSubjects(subjectResultOptions)
      .build()

다중 주체 비트맵

마찬가지로 각 주체의 비트맵을 사용 설정할 수 있습니다.

Kotlin

val subjectResultOptions = SubjectSegmenterOptions.SubjectResultOptions.Builder()
    .enableSubjectBitmap()
    .build()

val options = SubjectSegmenterOptions.Builder()
    .enableMultipleSubjects(subjectResultOptions)
    .build()

Java

SubjectResultOptions subjectResultOptions =
      new SubjectSegmenterOptions.SubjectResultOptions.Builder()
        .enableSubjectBitmap()
        .build()

SubjectSegmenterOptions options = new SubjectSegmenterOptions.Builder()
      .enableMultipleSubjects(subjectResultOptions)
      .build()

주체 분할기 만들기

SubjectSegmenterOptions 옵션을 지정한 후 SubjectSegmenter 인스턴스를 만들고 getClient()를 호출하고 옵션을 매개변수로 전달합니다.

Kotlin

val segmenter = SubjectSegmentation.getClient(options)

Java

SubjectSegmenter segmenter = SubjectSegmentation.getClient(options);

3. 이미지 처리

준비된 InputImage 객체를 SubjectSegmenter's process 메서드에 전달합니다.

Kotlin

segmenter.process(inputImage)
    .addOnSuccessListener { result ->
        // Task completed successfully
        // ...
    }
    .addOnFailureListener { e ->
        // Task failed with an exception
        // ...
    }

Java

segmenter.process(inputImage)
    .addOnSuccessListener(new OnSuccessListener() {
            @Override
            public void onSuccess(SubjectSegmentationResult result) {
                // Task completed successfully
                // ...
            }
        })
        .addOnFailureListener(new OnFailureListener() {
            @Override
            public void onFailure(@NonNull Exception e) {
                // Task failed with an exception
                // ...
            }
        });

4. 주체 분할 결과 가져오기

전경 마스크 및 비트맵 가져오기

처리되면 다음과 같이 getForegroundConfidenceMask()를 호출하여 이미지의 전경 마스크를 가져올 수 있습니다.

Kotlin

val colors = IntArray(image.width * image.height)

val foregroundMask = result.foregroundConfidenceMask
for (i in 0 until image.width * image.height) {
  if (foregroundMask[i] > 0.5f) {
    colors[i] = Color.argb(128, 255, 0, 255)
  }
}

val bitmapMask = Bitmap.createBitmap(
  colors, image.width, image.height, Bitmap.Config.ARGB_8888
)

Java

int[] colors = new int[image.getWidth() * image.getHeight()];

FloatBuffer foregroundMask = result.getForegroundConfidenceMask();
for (int i = 0; i < image.getWidth() * image.getHeight(); i++) {
  if (foregroundMask.get() > 0.5f) {
    colors[i] = Color.argb(128, 255, 0, 255);
  }
}

Bitmap bitmapMask = Bitmap.createBitmap(
      colors, image.getWidth(), image.getHeight(), Bitmap.Config.ARGB_8888
);

다음과 같이 getForegroundBitmap()을 호출하여 이미지의 포그라운드 비트맵을 가져올 수도 있습니다.

Kotlin

val foregroundBitmap = result.foregroundBitmap

Java

Bitmap foregroundBitmap = result.getForegroundBitmap();

각 주체의 마스크 및 비트맵 가져오기

마찬가지로 다음과 같이 각 주체에서 getConfidenceMask()를 호출하여 분할된 주체의 마스크를 가져올 수 있습니다.

Kotlin

val subjects = result.subjects

val colors = IntArray(image.width * image.height)
for (subject in subjects) {
  val mask = subject.confidenceMask
  for (i in 0 until subject.width * subject.height) {
    val confidence = mask[i]
    if (confidence > 0.5f) {
      colors[image.width * (subject.startY - 1) + subject.startX] =
          Color.argb(128, 255, 0, 255)
    }
  }
}

val bitmapMask = Bitmap.createBitmap(
  colors, image.width, image.height, Bitmap.Config.ARGB_8888
)

Java

List subjects = result.getSubjects();

int[] colors = new int[image.getWidth() * image.getHeight()];
for (Subject subject : subjects) {
  FloatBuffer mask = subject.getConfidenceMask();
  for (int i = 0; i < subject.getWidth() * subject.getHeight(); i++) {
    float confidence = mask.get();
    if (confidence > 0.5f) {
      colors[width * (subject.getStartY() - 1) + subject.getStartX()]
          = Color.argb(128, 255, 0, 255);
    }
  }
}

Bitmap bitmapMask = Bitmap.createBitmap(
  colors, image.width, image.height, Bitmap.Config.ARGB_8888
);

다음과 같이 분할된 각 주체의 비트맵에 액세스할 수도 있습니다.

Kotlin

val bitmaps = mutableListOf()
for (subject in subjects) {
  bitmaps.add(subject.bitmap)
}

Java

List bitmaps = new ArrayList<>();
for (Subject subject : subjects) {
  bitmaps.add(subject.getBitmap());
}

성능 개선을 위한 도움말

각 앱 세션에서 첫 번째 추론은 모델 초기화로 인해 후속 추론보다 느린 경우가 많습니다. 지연 시간이 짧아야 하는 경우 미리 '더미' 추론을 호출하는 것이 좋습니다.

결과의 품질은 입력 이미지의 품질에 따라 달라집니다.

ML Kit에서 정확한 분할 결과를 얻으려면 이미지의 크기가 512x512픽셀 이상이어야 합니다.
이미지 초점이 잘 맞지 않으면 정확도에 영향을 미칠 수도 있습니다. 인식 결과가 만족스럽지 않다면 사용자에게 이미지를 다시 캡처하도록 요청합니다.

Android용 ML Kit를 사용한 주제 세분화 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

사용해 보기

시작하기 전에

1. 입력 이미지 준비

media.Image 사용

Kotlin

Java

Kotlin

Java

Kotlin

Java

파일 URI 사용

Kotlin

Java

ByteBuffer 또는 ByteArray 사용

Kotlin

Java

Bitmap 사용

Kotlin

Java

2. SubjectSegmenter 인스턴스 만들기

분할기 옵션 정의

Kotlin

Java

전경 신뢰도 마스크

Kotlin

Java

전경 비트맵

Kotlin

Java

다중 주체 신뢰도 마스크

Kotlin

Java

다중 주체 비트맵

Kotlin

Java

주체 분할기 만들기

Kotlin

Java

3. 이미지 처리

Kotlin

Java

4. 주체 분할 결과 가져오기

전경 마스크 및 비트맵 가져오기

Kotlin

Java

Kotlin

Java

각 주체의 마스크 및 비트맵 가져오기

Kotlin

Java

Kotlin

Java

성능 개선을 위한 도움말

Android용 ML Kit를 사용한 주제 세분화

`media.Image` 사용

`ByteBuffer` 또는 `ByteArray` 사용

`Bitmap` 사용