Tìm hiểu chi tiết các tính năng lọc và giới hạn dữ liệu về hiệu suất trong Search Console

Thứ Tư, ngày 19 tháng 10 năm 2022

Dữ liệu hiệu suất trên Google Tìm kiếm là dữ liệu được sử dụng rộng rãi nhất trong Search Console, thông qua cả Báo cáo hiệu suấtSearch Analytics API. Bài đăng này giải thích chi tiết dữ liệu hiện có và cách Google xử lý dữ liệu đó, bao gồm cả việc lọc để bảo vệ quyền riêng tư và các hạn chế khác liên quan đến độ trễ khi phân phát, bộ nhớ và tài nguyên xử lý. Bạn có bao giờ tự hỏi các hệ thống này hoạt động như thế nào không? Hãy cùng tìm hiểu kỹ hơn về chúng.

Nếu bạn mới sử dụng Search Console, hãy tham khảo bài viết Giới thiệu về Báo cáo hiệu suất.

Thông tin cơ bản về hiệu suất tìm kiếm

Báo cáo hiệu suất bao gồm 4 chỉ số cho biết sự thay đổi của lưu lượng truy cập tìm kiếm của bạn theo thời gian. Chúng tôi có một bài viết mô tả cách tính từng chỉ số này và sau đây là nội dung tóm tắt:

  • Lượt nhấp: Số lượt nhấp của người dùng qua kết quả của Google Tìm kiếm vào tài sản của bạn.
  • Lượt hiển thị: Số lượt người dùng thấy tài sản của bạn trên kết quả tìm kiếm của Google.
  • CTR (Tỷ lệ nhấp): Số lượt nhấp chia cho số lượt hiển thị.
  • Vị trí: Vị trí trung bình trong kết quả tìm kiếm cho URL, cụm từ tìm kiếm hoặc trang web nói chung.

Mỗi chỉ số trong số đó có thể được phân tích theo nhiều phương diện. Bạn có thể kiểm tra hiệu suất của từng cụm từ tìm kiếm, trang, quốc gia, thiết bị hoặc giao diện tìm kiếm đang mang lại lưu lượng truy cập đến trang web của bạn.

Có nhiều cách để truy cập vào dữ liệu về hiệu suất trên Tìm kiếm, trong đó có giao diện sản phẩm, Search Analytics APL, trình kết nối Looker Studio và bảng tính (cần phải tải xuống theo cách thủ công qua giao diện).

Nếu đang sử dụng giao diện sản phẩm, bạn có thể xem các phương diện hiện có thông qua bộ lọc hoặc thông qua bảng phương diện theo sau biểu đồ, như thể hiện trong ảnh dưới đây.

Báo cáo hiệu suất trong Search Console

Bạn có thể dùng dữ liệu này để tìm cách cải thiện sự hiện diện của trang web và rốt cục là nhận được thêm lưu lượng truy cập qua Google. Để xem ví dụ về loại hình phân tích bạn có thể thực hiện, hãy tham khảo biểu đồ tối ưu hoá mẫu này.

Lọc và giới hạn dữ liệu

Cả dữ liệu trong giao diện báo cáo và dữ liệu được xuất đều được tổng hợp và lọc theo nhiều cách. Dưới đây là hai giới hạn chính đối với dữ liệu: lọc để bảo vệ quyền riêng tư và giới hạn hàng dữ liệu hằng ngày.

Lọc để bảo vệ quyền riêng tư

Một số cụm từ tìm kiếm (gọi là cụm từ tìm kiếm ẩn danh) không được đưa vào dữ liệu của Search Console để bảo vệ quyền riêng tư của người dùng tìm kiếm bằng cụm từ đó.

Cụm từ tìm kiếm ẩn danh là những cụm từ có chưa đầy vài chục người dùng sử dụng trong 2-3 tháng. Để bảo vệ quyền riêng tư, các cụm từ tìm kiếm thực tế sẽ không xuất hiện trong dữ liệu về hiệu suất trên Tìm kiếm. Đây là lý do chúng tôi gọi chúng là cụm từ tìm kiếm ẩn danh. Tuy các cụm từ tìm kiếm ẩn danh thực tế luôn bị bỏ qua trong các bảng, nhưng chúng vẫn được đưa vào tổng số trong biểu đồ, trừ phi bạn lọc theo cụm từ tìm kiếm.

Hãy xem ví dụ để hình dung rõ hơn – xin lưu ý rằng tuy đây là nội dung minh họa có tính đến chế độ lọc để bảo vệ quyền riêng tư nhưng các giới hạn hàng dữ liệu hằng ngày được thảo luận trong phần tiếp theo cũng có thể có tác động, hãy đọc tiếp để tìm hiểu thêm. Giả sử bảng dưới đây cho thấy toàn bộ lưu lượng cho cụm từ tìm kiếm dẫn đến trang web của bạn, phân nhóm lưu lượng truy cập qua các cụm từ tìm kiếm không ẩn danh. Tất nhiên là một trang web thông thường sẽ có nhiều hơn 4 cụm từ tìm kiếm không ẩn danh, nhưng đối với ví dụ này, hãy coi như chỉ có 4 cụm từ được phân nhóm.

Cụm từ tìm kiếm Lượt nhấp
văn học cổ điển 150
thơ 125
khoa học viễn tưởng 100
phi hư cấu 75
Tổng số cụm từ tìm kiếm được phân nhóm 450
Tổng số nói chung 550

Nếu bạn cộng tổng tất cả cụm từ tìm kiếm được phân nhóm (như thể hiện trong biểu đồ) thì có 450 lượt nhấp. Tổng số lượt nhấp vào trang web lại là 550. Con số này cao hơn vì bao gồm toàn bộ lượt nhấp được chia phân nhóm cộng với lượt nhấp qua các cụm từ tìm kiếm ẩn danh không được liệt kê.

Trên thực tế, khi sử dụng tính năng báo cáo trong Search Console, bạn có thể nhận thấy sự chênh lệch này theo 2 cách chính.

  1. Không có hàng nào cho cụm từ tìm kiếm ẩn danh trong bảng báo cáo hoặc API (được thêm vào đây cho mục đích minh hoạ), vì vậy nếu tính tổng số lượt nhấp của tất cả các hàng, bạn sẽ không ra được con số tổng giống với trong biểu đồ. Ví dụ: trong trường hợp này, kết quả tính tổng các hàng là 450 nhưng biểu đồ lại cho thấy tổng số là 550.
  2. Các cụm từ tìm kiếm ẩn danh sẽ bị bỏ qua mỗi khi một bộ lọc được áp dụng. Vì vậy, sẽ có sự chênh lệch khi bạn so sánh tổng số lượt nhấp trong tổng số trên biểu đồ với tổng số lượt nhấp có chứa some_string và không chứa some_string. Trong trường hợp này, nếu sử dụng bộ lọc để chỉ tính những cụm từ tìm kiếm có từ "viễn tưởng", bạn sẽ thấy 175 lượt nhấp và nếu loại trừ những cụm từ tìm kiếm có từ "viễn tưởng", bạn sẽ thấy 275 lượt nhấp, tổng cộng là 450 lượt nhấp, trong khi bạn sẽ thấy 550 lượt nhấp trên biểu đồ.

Giới hạn hàng dữ liệu hằng ngày

Do những giới hạn liên quan đến độ trễ phân phát, bộ nhớ, tài nguyên xử lý, v.v., Search Console có giới hạn về lượng dữ liệu có thể hiển thị hoặc xuất được. Những giới hạn này sẽ không ảnh hưởng đến phần lớn tài sản trong Search Console. Một vài trang web rất lớn có thể bị ảnh hưởng bởi việc này, nhưng ngay cả với những trang web như vậy, chúng tôi vẫn tin rằng dữ liệu còn lại là đủ lớn để tạo một mẫu dữ liệu mang tính đại diện.

Bạn có thể xuất tối đa 1.000 hàng dữ liệu qua giao diện người dùng Search Console. Hiện tại, giới hạn tối đa cho dữ liệu được xuất qua API Search Analytics (và thông qua trình kết nối Looker Studio) là 50.000 hàng mỗi ngày cho mỗi trang web cho mỗi loại tìm kiếm; không phải trường hợp nào cũng đạt đến giới hạn này. Theo mặc định, API trả về 1.000 hàng, nhưng bạn có thể sử dụng rowLimit để tăng lên 25.000 và startRow để lấy các hàng từ 25.001 đến 50.000 bằng cách sử dụng tính năng phân trang. Hãy tham khảo hướng dẫn này để tìm hiểu cách lấy dữ liệu hiện có.

Đối với những yêu cầu không liên quan đến các phương diện về URL hoặc cụm từ tìm kiếm (chẳng hạn như quốc gia, thiết bị và Giao diện tìm kiếm), Search Console sẽ cho thấy và xuất toàn bộ dữ liệu.

Tài nguyên và ý kiến phản hồi

Nếu bạn muốn tìm hiểu thêm về chủ đề này, hãy đọc Tài liệu về hiệu suất. Bạn sẽ tìm thấy thông tin giải thích chi tiết về dữ liệu hiện có, cách sử dụng Báo cáo hiệu suất và thông tin chi tiết khác về những chênh lệch mà có thể bạn nhận thấy trong biểu đồ.

Nếu bạn có thắc mắc hoặc lo ngại, vui lòng liên hệ với chúng tôi qua Cộng đồng Trung tâm Google Tìm kiếm hoặc qua Twitter.