نظرة عامة على Meet Media API

تتيح لك Google Meet Media API الوصول إلى الوسائط في الوقت الفعلي من مؤتمرات Google Meet. يتيح ذلك مجموعة متنوعة من حالات الاستخدام، مثل التطبيقات التي توثّق بنود العمل أو تقدّم إحصاءات في الوقت الفعلي حول الاجتماع الحالي أو تبث الصوت والفيديو إلى سطح جديد.

حالات الاستخدام

يمكن للتطبيقات المسجّلة في Google Cloud Console استخدام Meet Media API للاتصال بمؤتمرات Meet، ما يتيح لها إجراء ما يلي:

  • استهلاك بث الفيديو على سبيل المثال:
    • إدخال بث مباشر لفيديوهات تم إنشاؤها في اجتماعات Meet إلى نماذج الذكاء الاصطناعي الخاصة بك
    • فلترة أحداث البث حسب التسجيلات المخصّصة
  • استهلاك بث الصوت على سبيل المثال:
    • يمكنك إدخال الصوت مباشرةً إلى Gemini وإنشاء روبوت محادثة خاص بك يعمل بالذكاء الاصطناعي.
    • إرسال بث مباشر لملفات الصوت التي يتم إنشاؤها في اجتماعات Meet إلى خدمة تحويل الصوت إلى نص
    • إنشاء ترجمة وشرح بلغات مختلفة
    • إنشاء خلاصات لغة الإشارة من إنشاء النماذج من المحتوى الصوتي الذي تم التقاطه
    • يمكنك إنشاء نماذج لإزالة الضوضاء من الخلفية والتشويش من الاجتماع.
  • استهلاك البيانات الوصفية للمشاركين على سبيل المثال:
    • رصد المشاركين في المؤتمر، ما يتيح الحصول على معلومات وتحليلات أفضل

دورة حياة Meet Media API

تعرض الصور التالية دورة حياة Meet Media API:

  • يحاول برنامج Meet Media API الانضمام إلى الموقع الإلكتروني التابع لجهة خارجية.
    الشكل 1. يحاول برنامج Meet Media API الانضمام إلى الاجتماع من الموقع الإلكتروني التابع لجهة خارجية. يتم رفض الربط في حال توفّر حسابات قاصرين.
  • الاجتماعات المُشفَّرة والاجتماعات التي تتضمّن علامة مائية
    الشكل 2. يمكن وضع علامة على الاجتماعات بأنّها مشفّرة وإضافة علامة مائية إليها. لا يمكن ربط واجهة برمجة التطبيقات Meet Media API عندما يكون الاجتماع مشفَّرًا أو يتضمّن علامة مائية.
  • تأكَّد من صحة إعدادات المشرف.
    الشكل 3. تأكَّد من صحة إعدادات المشرف.
  • إعداد الاجتماع في "تقويم Google"
    الشكل 4. إعداد الاجتماع في "تقويم Google" على المضيف منح الإذن للتطبيق التابع لجهة خارجية في إعدادات "تقويم Google"، وإلا سيتم رفض الربط.
  • تغيير الإعدادات أثناء المكالمة
    الشكل 5. تغيير أحد الإعدادات أثناء المكالمة إذا قرر المضيف إيقاف خيار Meet Media API أثناء المكالمة، سيتوقف الاتصال.
  • يجب أن يكون الشخص الذي بدأ الاجتماع حاضرًا أثناء اجتماعات المستهلكين.
    الشكل 6. إذا كان مالك الاجتماع لديه حساب مستهلك (حساب ينتهي بالنطاق ‎ @gmail.com)، يجب أن يكون الشخص الذي بدأ الاجتماع حاضرًا للموافقة على الربط، وإلا سيتم رفض الربط.
  • تم إنشاء الاتصال.
    الشكل 7. بعد إنشاء الاتصال، يظهر مربّع حوار بدء الميزة للمضيف أو المضيف المشارك أو أي مشاركين في المؤسسة نفسها التي ينتمي إليها المضيف.
  • يمكن لأي شخص إيقاف Meet Media API أثناء المكالمة.
    الشكل 8. يمكن لأي مشارك إيقاف Meet Media API أثناء المكالمة.

عبارات عامة

رقم مشروع Cloud
معرّف int64 غير قابل للتغيير تم إنشاؤه لمشروع Google Cloud. يتم إنشاء هذه القيم من خلال Google Cloud Console لكل تطبيق مسجَّل.
المؤتمر
مثيل من إنشاء الخادم لمكالمة ضمن مساحة اجتماع يعتبر المستخدمون عادةً هذا السيناريو اجتماعًا واحدًا.
قناة بيانات المراجع الخاصة بالمؤتمرات

بدلاً من طلب الموارد عبر HTTP، كما هو الحال مع Google Meet REST API، يطلب عملاء Meet Media API الموارد من الخادم عبر قنوات البيانات.

يمكن فتح قناة بيانات مخصّصة لكل نوع من أنواع الموارد. بعد فتح القناة، يمكن للعميل إرسال الطلبات عبرها. سيتم إرسال تحديثات الموارد عبر القناة نفسها.

المصدر المساهم (CSRC)

باستخدام عمليات بث الوسائط الافتراضية، لا يمكنك افتراض أنّ عملية بث الوسائط تشير دائمًا إلى المشارك نفسه. تحدّد قيمة CSRC في رأس كل حزمة RTP المصدر الحقيقي للحزمة.

يُعيّن Meet لكل مشارك في مؤتمر قيمة CSRC فريدة عند انضمامه. وتظل هذه القيمة ثابتة إلى أن يغادر المستخدم.

قنوات البيانات

تتيح قنوات بيانات WebRTC تبادل بيانات عشوائية (نصوص وملفات وما إلى ذلك) بشكل مستقل عن بث الصوت والفيديو. تستخدم قنوات البيانات الاتصال نفسه الذي تستخدمه وسائط البث، ما يوفّر طريقة فعّالة لإضافة تبادل البيانات إلى تطبيقات WebRTC.

تأسيس الاتصال التفاعلي (ICE)

بروتوكول لإنشاء اتصال والعثور على جميع المسارات الممكنة لتواصل جهازَي كمبيوتر مع بعضهما البعض من خلال شبكة نظير إلى نظير (P2P)، ثم التأكّد من بقائك على اتصال.

بث الوسائط

يمثّل بث الوسائط عبر WebRTC تدفقًا لبيانات الوسائط، مثل الصوت أو الفيديو، يتم التقاطها من جهاز مثل كاميرا أو ميكروفون. ويتألف من واحد أو أكثر من مقاطع بث الوسائط، ويمثّل كل منها مصدرًا واحدًا للوسائط، مثل مقطع فيديو أو مقطع صوتي.

مقطع بث الوسائط

تتألف من تدفق واحد أحادي الاتجاه لحِزم بروتوكول النقل في الوقت الفعلي (RTP). يمكن أن يكون مسار بث الوسائط صوتًا أو فيديو، ولكن ليس كليهما. يتألف اتصال بروتوكول النقل الآمن في الوقت الفعلي (SRTP) الثنائي الاتجاه عادةً من مسارَين لتدفق الوسائط، أحدهما للخروج من الجهاز المحلي إلى جهاز الندير البعيد، والآخر للدخول من جهاز الندير البعيد إلى الجهاز المحلي.

مساحة الاجتماع

تمثّل هذه السمة مكانًا افتراضيًا أو عنصرًا ثابتًا (مثل غرفة اجتماعات) يتم فيه عقد مؤتمر. يمكن عقد اجتماع فيديو نشط واحد فقط في مساحة واحدة في أي وقت. تساعد مساحة الاجتماعات أيضًا المستخدمين في الاجتماع والعثور على المراجع المشترَكة.

المشارك

انضمام مستخدم إلى مؤتمر أو استخدام وضع المزاملة أو المشاهدة كمشاهد أو ربط جهاز غرفة بمكالمة عندما ينضم مشارك إلى المؤتمر، يتم تخصيص رقم تعريف فريد له.

ساحات المشاركات ذات الصلة

هناك حدّ أقصى لعدد مقاطع الصوت الافتراضية ومقاطع الفيديو الافتراضية التي يمكن للعميل فتحها.

من المحتمل جدًا أن يتجاوز عدد المشاركين في مؤتمر هذا العدد. في هذه الحالات، تنقل خوادم Meet بث الصوت والفيديو للمشاركين الذين يتم اعتبارهم "الأكثر صلة". يتم تحديد مدى الصلة بالموضوع من خلال خصائص مختلفة، مثل مشاركة الشاشة ومدى حداثة مشاركة أحد المشاركين في المحادثة.

وحدة إعادة التوجيه الانتقائي (SFU)

وحدة إعادة التوجيه الانتقائي (SFU) هي أحد مكونات WebRTC من جهة الخادم، وتدير عملية توزيع بث الوسائط في مؤتمرات WebRTC. يتصل المشاركون بخادم SFU فقط، الذي يعيد توجيه المحتوى ذي الصلة بشكل انتقائي إلى المشاركين الآخرين. يقلّل ذلك من احتياجات المعالجة ومعدل نقل البيانات لدى العميل، ما يتيح عقد مؤتمرات قابلة للتوسيع.

بروتوكول وصف الجلسة (SDP)

آلية إرسال الإشارات التي تستخدمها WebRTC للتفاوض بشأن اتصال "شبكة الند للند" وتخضع هذه البيانات لسياسة RFC 8866.

إجابة SDP

الردّ على عرض SDP يرفض الرد أو يقبل أي تدفقات تم تلقّيها من الجهاز البعيد. ويتفاوض أيضًا بشأن عمليات البث التي يخطط لإرسالها مرة أخرى إلى الجهاز الآخر. من المهم ملاحظة أنّه لا يمكن لردّ SDP إضافة بثوط تم الإبلاغ عنها من العرض الأوّلي. على سبيل المثال، إذا أشار أحد الأجهزة إلى أنّه يقبل ما يصل إلى ثلاثة مصادر صوت من الجهاز البعيد، لا يمكن للجهاز البعيد الإشارة إلى أربعة مصادر صوت لإرسالها.

عرض بروتوكول وصف الجلسة (SDP)

بروتوكول وصف الجلسة (SDP) الأوّلي في عملية التفاوض بين الأجهزة المتصلة مباشرةً من خلال عرض الإمكانات والردّ عليها يتم إنشاء العرض من خلال الجهاز النظير الذي يبدأ الجلسة، ويحدد العرض بنود جلسة الاتصال بين الأجهزة النظيرة. يتم إنشاء العرض دائمًا من خلال برنامج Meet Media API وإرساله إلى خوادم Meet.

على سبيل المثال، قد يشير العرض إلى عدد بثوق الصوت أو الفيديو التي يرسلها (أو يمكنه استقبالها) مقدّم العرض وما إذا كان سيتم فتح قنوات البيانات.

مصدر المزامنة (SSRC)

معرّف SSRC هو معرّف يبلغ 32 بت ويحدّد بشكل فريد مصدرًا واحدًا لتدفق وسائط ضمن جلسة RTP (بروتوكول النقل في الوقت الفعلي). في WebRTC، يتم استخدام أرقام تعريف مصدر الحزمة المتزامنة (SSRC) للتمييز بين تدفقات الوسائط المختلفة الواردة من مشاركين مختلفين أو حتى مسارات مختلفة من المشارك نفسه (مثل الكاميرات المختلفة).

RtpTransceiver

كما هو موضّح بالتفصيل في RFC 8829، جهاز الإرسال والاستقبال هو تجريد لتدفّقات RTP في جلسة من نظير إلى نظير.

يتم ربط جهاز إرسال واستقبال واحد بوصف وسائط واحد في بروتوكول وصف الجلسة (SDP)، ويتم وصفه من خلال هذا الوصف. يتألف جهاز الإرسال والاستقبال من RtpSender وRtpReceiver.

بما أنّ بروتوكول النقل في الوقت الفعلي (RTP) ثنائي الاتجاه، يكون لكل جهاز نظير مثيل جهاز إرسال واستقبال خاص به لاتصال بروتوكول النقل في الوقت الفعلي نفسه. يتم ربط RtpSender لجهاز إرسال واستقبال معيّن بالجهاز المحلي RtpReceiver لجهاز إرسال واستقبال محدّد في الجهاز البعيد. والعكس صحيح أيضًا. يتم ربط RtpSender لجهاز الإرسال والاستقبال نفسه الخاص بالجهاز البعيد بـ RtpReceiver للجهاز المحلي.

يحتوي كل وصف وسائط على جهاز إرسال واستقبال مخصّص. وبالتالي، تتضمّن جلسة من نظير إلى نظير مع مجموعات بث RTP متعددة أجهزة إرسال واستقبال متعددة مع عدة RtpSenders وRtpReceiver لكل نظير.

Virtual Media Streams

عمليات بث الوسائط الافتراضية هي عمليات بث وسائط مجمّعة تنشئها وحدة إعادة توجيه انتقائية (SFU) في مؤتمرات WebRTC. بدلاً من أن يرسل كل مشارك تدفقات فردية إلى جميع المشاركين الآخرين، يدمج SFU تدفقات المشاركين المحدّدة في عدد أقل من التدفقات الافتراضية الصادرة. يؤدي ذلك إلى تبسيط بنية الاتصال وتقليل الحمل على المشاركين، ما يتيح إمكانية توسيع نطاق المؤتمرات. يمكن أن يحتوي كل بث افتراضي على وسائط من عدة مشاركين، ويديرها SFU بشكل ديناميكي.