סקירה כללית על Meet Media API

‫Google Meet Media API מאפשר לכם לגשת למדיה בזמן אמת משיחות ועידה ב-Google Meet. התכונה הזו מאפשרת מגוון תרחישי שימוש, כמו אפליקציות שמתעדות פעולות לביצוע, מספקות תובנות בזמן אמת לגבי הפגישה הנוכחית או מעבירות אודיו ווידאו בסטרימינג לממשק חדש.

תרחישים לדוגמה

אפליקציות שרשומות ב-Google Cloud Console יכולות להשתמש ב-Meet Media API כדי להתחבר לוועידות ב-Meet, וכך:

  • צפייה בשידורי וידאו. לדוגמה:
    • הזנת סטרימינג של סרטונים שנוצרו בשיחות ועידה ב-Meet למודלים של AI משלכם.
    • סינון של הסטרימינג להקלטות בהתאמה אישית.
  • צריכת שידורי אודיו. לדוגמה:
    • אפשר להזין אודיו ישירות ל-Gemini וליצור צ'אט בוט מבוסס-AI לפגישות.
    • העברת שידורי אודיו משיחות ועידה ב-Meet לשירות תמלול משלכם
    • ליצור כתוביות בשפות שונות.
    • ליצור פידים של שפת סימנים שנוצרו על ידי מודל מהאודיו שתועד.
    • ליצור מודלים משלכם לסינון רעשים כדי להסיר רעשי רקע וחפצים רועשים מהשיחה.
  • צריכת מטא-נתונים של משתתפים. לדוגמה:
    • לזהות מי מהמשתתפים נמצא בוועידה, כדי לשפר את הניתוח והתובנות.

מחזור החיים של Meet Media API

בתמונות הבאות מוצג מחזור החיים של Meet Media API:

  • בוט של Meet Media API מנסה להצטרף לאתר של צד שלישי.
    איור 1. הבוט של Meet Media API מנסה להצטרף לאתר של הצד השלישי. החיבור נדחה אם יש חשבונות של משתמשים מתחת לגיל 18.
  • פגישות מוצפנות ופגישות עם סימן מים.
    איור 2. אפשר לסמן פגישות כמוצפנות ולהוסיף להן סימן מים. אי אפשר להתחבר ל-Meet Media API אם הפגישה מוצפנת או שיש בה סימן מים.
  • מוודאים שהגדרת האדמין נכונה.
    איור 3. מוודאים שההגדרה של האדמין נכונה.
  • מגדירים את הפגישה ביומן.
    איור 4. מגדירים את הפגישה ביומן. המארח צריך לתת הרשאה לאפליקציית הצד השלישי בהגדרות היומן, אחרת החיבור יידחה.
  • שינוי ההגדרה במהלך השיחה.
    איור 5. שינוי בהגדרה במהלך השיחה. אם המארח מחליט להשבית את ההגדרה של Meet Media API במהלך שיחה, החיבור נפסק.
  • היוזם חייב להיות נוכח בפגישות עם צרכנים.
    איור 6. אם הבעלים של הפגישה משתמש בחשבון פרטי (חשבון שמסתיים ב-‎ @gmail.com), היוזם חייב להיות נוכח בפגישה כדי לתת הסכמה, אחרת החיבור יידחה.
  • החיבור נוצר.
    איור 7. אחרי שהחיבור נוצר, המארח, המארחים הנוספים או כל המשתתפים באותו הארגון של המארח רואים את תיבת הדו-שיח של ההתחלה.
  • כל המשתתפים בשיחה יכולים להפסיק את השימוש בממשקי Meet Media API במהלך השיחה.
    איור 8. כל המשתתפים בשיחה יכולים להפסיק את השימוש ב-Meet Media API.

הדרישות לקבלת הסכמה

אפליקציות של Meet Media API יכולות להצטרף לפגישה רק אם יש בה משתתף שיש לו הרשאה לתת הסכמה בשם הפגישה.

לפגישות ב-Google Workspace

כדי לתת הסכמה בפגישות ב-Google Workspace, אתם צריכים להיות חלק מהארגון שהוא הבעלים של הפגישה. ברוב המקרים, הבעלים של הפגישה הוא אותו אדם שמארגן אותה. אם המארח או מי שהפעיל את ההקלטה נמצאים בפגישה וגם שייכים לארגון שבבעלותו הפגישה, הם יראו את תיבת הדו-שיח של ההתחלה.

לפגישות לצרכנים

בפגישות שאורגנו באמצעות חשבונות Gmail, היוזם צריך להיות בפגישה כדי לתת הסכמה.

מונחים נפוצים

מספר פרויקט בענן
מזהה קבוע שנוצר int64 לפרויקט ב-Google Cloud. הערכים האלה נוצרים על ידי מסוף Google Cloud לכל אפליקציה רשומה.
ועידה
מופע שנוצר בשרת של שיחה במרחב לפגישות. בדרך כלל המשתמשים מתייחסים לתרחיש הזה כאל פגישה אחת.
ערוץ נתונים של משאבים לשיחות ועידה

במקום לבקש משאבים באמצעות HTTP, כמו ב-Google Meet API בארכיטקטורת REST, לקוחות של Meet Media API מבקשים משאבים מהשרת באמצעות ערוצי נתונים.

יכול להיות שייפתח ערוץ נתונים ייעודי לכל סוג משאב. אחרי הפתיחה, הלקוח יכול לשלוח בקשות בערוץ. עדכוני משאבים יועברו באותו ערוץ.

מקור תורם (CSRC)

בזרמי מדיה וירטואליים, אי אפשר להניח שזרם מדיה תמיד מצביע על אותו משתתף. ערך ה-CSRC בכותרת של כל חבילת RTP מזהה את המקור האמיתי של החבילה.

מערכת Meet מקצה לכל משתתף בשיחת ועידה ערך CSRC ייחודי כשהוא מצטרף. הערך הזה נשאר קבוע עד שהם עוזבים.

ערוצי נתונים

ערוצי נתונים של WebRTC מאפשרים להחליף נתונים שרירותיים (טקסט, קבצים וכו') בנפרד מזרמי אודיו ווידאו. ערוצי נתונים משתמשים באותו חיבור כמו זרמי מדיה, ומספקים דרך יעילה להוסיף חילופי נתונים לאפליקציות WebRTC.

Interactive Connectivity Establishment (ICE)

פרוטוקול ליצירת קישוריות, למציאת כל המסלולים האפשריים לשני מחשבים כדי לתקשר זה עם זה באמצעות רשתות עמית לעמית (P2P), ואז לוודא שהחיבור נשמר.

סטרימינג של מדיה

מקור נתונים של מדיה ב-WebRTC מייצג זרם של נתוני מדיה, בדרך כלל אודיו או וידאו, שצולמו ממכשיר כמו מצלמה או מיקרופון. הוא מורכב מטראקים של שידורי מדיה אחד או יותר, שכל אחד מהם מייצג מקור מדיה יחיד, כמו טראק וידאו או טראק אודיו).

Media stream track

הוא מורכב מזרימה חד-כיוונית אחת של מנות RTP. רכיב MediaStream יכול להיות אודיו או וידאו, אבל לא שניהם. חיבור דו-כיווני של פרוטוקול להעברה בטוחה בזמן אמת (SRTP) מורכב בדרך כלל משני ערוצי מדיה, יציאה מעמית מקומי לעמית מרוחק וכניסה מעמית מרוחק לעמית מקומי.

מקום הפגישה

מקום וירטואלי או אובייקט קבוע (כמו חדר ישיבות) שבו מתקיימת ועידה. בכל רגע נתון יכולה להתנהל רק שיחת ועידה פעילה אחת במרחב. בנוסף, מרחב לפגישות מאפשר למשתמשים להיפגש ולמצוא משאבים משותפים.

משתתף

אדם שהצטרף לשיחה או שמשתמש במצב Companion, צופה כמשתתף או שמכשיר בחדר מחובר לשיחה. כשמשתתף מצטרף לשיחת הוועידה, מוקצה לו מזהה ייחודי.

Relevant streams

יש מגבלה על מספר הזרמות האודיו הווירטואליות והזרמות הווידאו הווירטואליות שלקוח יכול לפתוח.

יכול להיות שמספר המשתתפים בשיחת ועידה יהיה גדול יותר. במקרים כאלה, שרתי Meet מעבירים את זרמי האודיו והווידאו של המשתתפים שנחשבים ל "הכי רלוונטיים". רמת הרלוונטיות נקבעת על סמך מאפיינים שונים, כמו שיתוף מסך והזמן שעבר מאז שהמשתתף דיבר.

יחידת העברה סלקטיבית (SFU)

יחידת העברה סלקטיבית (SFU) היא רכיב בצד השרת בשיחות ועידה ב-WebRTC שמנהל את ההפצה של זרם המדיה. המשתתפים מתחברים רק ל-SFU, שמעביר באופן סלקטיבי סטרימינג רלוונטי למשתתפים אחרים. כך מצטמצם העיבוד בצד הלקוח ורוחב הפס הדרוש, ומתאפשרות ועידות שניתנות להרחבה.

Session Description Protocol (SDP)

מנגנון האיתות ש-WebRTC משתמש בו כדי לנהל משא ומתן על חיבור P2P. RFC 8866.

תשובת SDP

התשובה להצעה ל-SDP. התשובה דוחה או מקבלת כל סטרימינג שהתקבל מהעמית המרוחק. הוא גם מנהל משא ומתן לגבי הזרמים שהוא מתכנן לשדר בחזרה למכשיר של העמית. חשוב לציין שלא ניתן להוסיף לתשובת ה-SDP זרמי נתונים שסומנו מההצעה הראשונית. לדוגמה, אם עמית שמציע שידור מציין שהוא מקבל עד שלושה זרמי אודיו מהעמית המרוחק שלו, העמית המרוחק הזה לא יכול לציין ארבעה זרמי אודיו לשידור.

מבצע SDP

ה-SDP הראשוני בתהליך המשא ומתן בין עמיתים של הצעה ותשובה. ההצעה נוצרת על ידי העמית היוזם ומכתיבה את התנאים של סשן עמית לעמית. המבצע תמיד נוצר על ידי לקוח Meet Media API ונשלח לשרתי Meet.

לדוגמה, יכול להיות שבהצעה יצוין מספר זרמי האודיו או הווידאו שהצד המציע שולח (או יכול לקבל), והאם צריך לפתוח ערוצי נתונים.

מקור סנכרון (SSRC)

מזהה SSRC הוא מזהה בן 32 ביט שמזהה באופן ייחודי מקור יחיד של זרם מדיה בתוך סשן RTP (פרוטוקול להעברה בזמן אמת). ב-WebRTC, מספרי ה-SSRC משמשים להבחנה בין זרמי מדיה שונים שמגיעים ממשתתפים שונים או אפילו מרצועות שונות של אותו משתתף (כמו מצלמות שונות).

RtpTransceiver

כפי שמפורט במאמר RFC 8829, משדר-מקלט הוא הפשטה של זרמי RTP בסשן תקשורת ישירה.

משדר-מקלט יחיד ממופה לתיאור מדיה יחיד ב-SDP ומתואר על ידו. משדר-מקלט מורכב מRtpSender ומRtpReceiver.

מכיוון ש-RTP הוא דו-כיווני, לכל עמית יש מופע משלו של משדר/מקלט לאותו חיבור RTP. ‫RtpSender של משדר-מקלט נתון עבור העמית המקומי ממופה ל-RtpReceiver של משדר-מקלט ספציפי בעמית המרוחק. ההפך הוא גם נכון. ‫RtpSender של אותו משדר/מקלט של עמית מרוחק ממופה ל-RtpReceiver של העמית המקומי.

לכל תיאור מדיה יש משדר/מקלט ייעודי משלו. לכן, בסשן עמית לעמית עם כמה שידורי RTP יש כמה משדרי רדיו עם כמה RtpSenders וRtpReceiver לכל עמית.

Virtual Media Streams

זרמי מדיה וירטואליים הם זרמי מדיה מצטברים שנוצרים על ידי יחידת העברה סלקטיבית (SFU) בוועידות WebRTC. במקום שכל משתתף ישלח לכל אחד אחר מקור נתונים נפרד, שרת ה-SFU מבצע מולטיפלקס של מקורות נתונים נבחרים של משתתפים למספר קטן יותר של מקורות נתונים וירטואליים יוצאים. הגישה הזו מפשטת את טופולוגיית החיבור ומפחיתה את העומס על המשתתפים, ומאפשרת לקיים ועידות שניתנות להרחבה. כל זרם וירטואלי יכול להכיל מדיה מכמה משתתפים, שמנוהלת באופן דינמי על ידי SFU.