يتم تسلسل خريطة العمق كمجموعة من خصائص XMP. وكجزء من عملية التسلسل، يتم أولاً تحويل خريطة العمق إلى تنسيق صورة تقليدي. تتضمّن عملية الترميز ثلاث خطوات (راجِع الشكل 2):
- تحويل البيانات من تنسيق الإدخال (مثل قيم float أو int32) إلى تنسيق صورة بتدرّج الرمادي من نوع عدد صحيح، مثل وحدات البايت (8 بت) أو الكلمات (16 بت)
- اضغط باستخدام برنامج ترميز صور عادي، مثل JPEG أو PNG.
- تسلسل كخاصية XMP لسلسلة base64.

يمكن أن تكون سلسلة المعالجة بدون فقدان البيانات أو مع فقدانها، وذلك حسب عدد وحدات البت في خريطة العمق الأصلية وعدد وحدات البت المستخدَمة لتخزينها، مثلاً 8 وحدات بت لبرنامج ترميز JPEG و8 أو 16 وحدة بت لبرنامج ترميز PNG.
يتوفّر حاليًا تنسيقان مختلفان: RangeLinear وRangeInverse. RangeInverse هو التنسيق المقترَح إذا كانت خريطة العمق ستفقد الدقة عند الترميز، مثلاً عند التحويل من قيمة عائمة إلى 8 بت. ويتم تخصيص عدد أكبر من البتات لقيم العمق القريبة وعدد أقل من البتات للقيم البعيدة، بطريقة مشابهة لطريقة عمل مخزن z المؤقت في بطاقات وحدة معالجة الرسومات.
إذا كانت خريطة العمق تتضمّن خريطة ثقة مرفقة، يتم أيضًا تحويل خريطة الثقة إلى تنسيق صورة تقليدي باستخدام مسار مشابه للمسار المستخدَم للعمق. يتم دائمًا ترميز خريطة الثقة باستخدام تنسيق RangeLinear، مع افتراض أنّ نطاق الثقة هو [0, 1].
RangeLinear
لنفترض أنّ d هو عمق البكسل، وأنّ near وfar هما الحدّ الأدنى والأقصى لقيم العمق التي يتم أخذها في الاعتبار. يتم أولاً تسوية قيمة العمق إلى النطاق [0, 1] على النحو التالي:
RangeInverse
لنفترض أنّ d هو عمق البكسل، وأنّ near وfar هما الحدّ الأدنى والأقصى لقيم العمق التي يتم أخذها في الاعتبار. يتم أولاً تسوية قيمة العمق إلى النطاق [0, 1] على النحو التالي: