דף זה תורגם על ידי Cloud Translation API.

הוספה של מידת הדירוג לדוח CrUX ב-BigQuery

Johannes Henkel

Barry Pollard

החל ממערך הנתונים של חודש פברואר 2021, אנחנו מוסיפים מדד ניסיוני לדוח CrUX ב-BigQuery שמבדיל את הפופולריות של מקורות לפי קנה מידה: 1,000 המקורות המובילים, 10,000 המובילים, 100,000 המובילים, מיליון המובילים...

בואו נראה איך זה נראה בפועל:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

שורה	rank_magnitude	num_origins
1	1,000	1,000
2	10,000	9,000
3	100,000	90,000
4	1,000,000	900,000
15	10,000,000	7,264,371

בקבוצת הנתונים הגלובלית של פברואר 2021, אנחנו מקבלים 5 קטגוריות. כמו כן, בשורה 1 ראינו שיש 1,000 מקורות עם דירוג גודל 1000 – אלף המקורות הפופולריים ביותר לפי המדד שלנו. שורה 2 עשויה להיראות מפתיעה, שמציינת שיש רק 9,000 מקורות בקבוצה של 10,000 המובילים. הסיבה לכך היא שגם המקורות בשורה 1 הם חלק מקבוצת 10,000 המובילים. כדי לבחור את 10,000 המקורות המובילים, יש לציין את query.popularity.rank <= 10000 בעת ביצוע שאילתות.

מערך הנתונים מכיל גם סולם דירוג ספציפי למדינה. לדוגמה, בשאילתה הזו מפורטים 10,000 המקורות שהם הפופולריים ביותר בגרמניה.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

כדי להסביר את הפוטנציאל של מדד הפופולריות החדש, נבחן את ההבדלים בין פלחי הפופולריות באינטרנט ביחס למדד הצגת התוכן הראשון (FCP). לצורך השאילתה הזו, שנייה אחת נחשבת חוויית משתמש מהירה.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

במקורות עם experimental.popularity.rank <= 1000, השאילתה מסכמת את כל צפיפות הקטגוריות של היסטוגרמה לערכי FCP שקטנים מ-1,000 אלפיות השנייה ומחלקת אותה במספר המקורות – כלומר, היא מחשבת את האחוז הממוצע של טעינות ה-FCP המהירות של 1,000 המקורות הפופולריים ביותר. בשאילתה הזו, לכל המקורות יש משקל שווה, ולכן אין ספק שזה לא מושלם. אבל בואו נראה אם התוצאה רגישה לשינוי גודל הדירוג. לשם כך, נשנה את המשפט 'איפה' כדי לציין את הערך להראות 'g במקרים של <= 10000'. אנחנו עושים את זה עבור 10,000, 100,000 וכן הלאה:

קנה המידה של דירוג המקורות	אחוז ה-FCP < 1s, בממוצע מהמקורות
1.000	53.6%
10,000	49.6%
100,000	45.9%
1,000,000	43.2%
10,000,000	39.9%

דבר זה מעיד על כך שחוויית משתמש מהירה יותר באינטרנט קשורה לפופולריות רבה יותר.

במערך הנתונים של אוקטובר 2022, חלוקת הנתונים הזו פוצלה לפי שלבים של חצי דירוג. הרצה מחדש של השאילתה הראשונה עבור מערך הנתונים הזה מראה את חצאי השלבים ואת מספר המקורות בכל סולם דירוג:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

שורה	rank_magnitude	num_origins
1	1,000	1,000
2	5,000	4,000
3	10,000	5,000
4	50,000	40,000
5	100,000	50,000
6	500,000	400,000
7	1,000,000	500,000
8	5,000,000	4,000,000
9	10,000,000	5,000,000
10	50,000,000	7,637,195

קראו מידע נוסף על השימוש ב-CUX ב-BigQuery ועיון ב-CrUX Cookbook לשאילתות נוספות. אנחנו מזמינים אותך לשתף את השאילתות שלך, ונשמח לעזור.