Nội dung cập nhật và các mẹo nhanh về bộ lọc biểu thức chính quy (regex) của Search Console

Thứ Tư, ngày 2 tháng 6 năm 2021

Gần đây, chúng tôi đã thông báo về việc cải thiện hệ thống lọc dữ liệu cho các Báo cáo hiệu suất trong Search Console. Chúng tôi rất vui mừng trước sự đón nhận của cộng đồng đối với thông báo đó.

Như mọi khi, chúng tôi cũng quan tâm đến ý kiến phản hồi nhận được. Trong số đó, chúng tôi nhận thấy có nhiều yêu cầu hoàn thiện tính năng này bằng cách thêm tùy chọn khớp phủ định vào bộ lọc biểu thức chính quy (regex).

Tin vui là bắt đầu từ hôm nay, bộ lọc cho Báo cáo hiệu suất sẽ hỗ trợ cả bộ lọc trùng khớp và bộ lọc phủ định không trùng khớp. Bạn có thể thấy tùy chọn này trong một trình đơn phụ thả xuống, trình đơn này xuất hiện sau khi nhấp vào tùy chọn "Tùy chỉnh (biểu thức chính quy)" trong bộ chọn bộ lọc, như minh họa trong ảnh chụp màn hình dưới đây. Tìm hiểu thêm về cách lọc dữ liệu về hiệu suất tìm kiếm.

Bộ lọc biểu thức chính quy cho Báo cáo hiệu suất trong Search Console

Mẹo về cách sử dụng biểu thức chính quy trên Search Console

Chúng tôi nghĩ rằng bạn sẽ cần một số mẹo khi mới bắt đầu sử dụng biểu thức chính quy.

Trước hết, biểu thức chính quy gì? Nói một cách ngắn gọn, đó là một chuỗi ký tự có vai trò chỉ định quy luật tìm kiếm. Từ đó, bạn có thể tạo bộ lọc nâng cao nhằm tìm kiếm hoặc loại trừ một từ/cụm từ và hơn thế nữa. Với biểu thức chính quy, bạn có thể dùng một số siêu ký tự, tức là những ký tự có ý nghĩa đặc biệt, chẳng hạn như để xác định một tiêu chí tìm kiếm. Hãy đọc tài liệu tham khảo về cú pháp của biểu thức chính quy RE2 để tìm hiểu về tất cả siêu ký tự mà Search Console hỗ trợ.

Nếu bạn muốn biết khi nào nên sử dụng biểu thức chính quy thay vì các loại bộ lọc khác, thì sau đây là một số ví dụ minh họa:

  • Chia phân khúc những người dùng đã biết thương hiệu của bạn – Hãy sử dụng biểu thức chính quy để chỉ định nhiều biến thể của tên công ty, bao gồm cả lỗi chính tả. Cách làm này sẽ cho bạn biết loại cụm từ tìm kiếm nào mà từng nhóm đang sử dụng và phần nào trên trang web của bạn đang thu hút từng đối tượng đó. Ví dụ: nếu tên công ty của bạn là Willow Tree, thì bạn nên tạo bộ lọc cho mọi biến thể như: willow tree|wilow tree|willowtree|willowtee (siêu ký tự | đại diện cho câu lệnh OR).
  • Phân tích lưu lượng truy cập đến một phần của trang web – Hãy sử dụng biểu thức chính quy để tập trung vào các thư mục cụ thể trên trang web của bạn. Cách làm này có thể giúp bạn nắm được những cụm từ tìm kiếm phổ biến cho từng vùng nội dung của mình. Ví dụ: nếu cấu trúc URL của bạn là example.com/[product]/[brand]/[size]/[color] và bạn muốn xem lưu lượng truy cập dẫn đến sản phẩm giày màu xanh lục mà không quan tâm đến thương hiệu hoặc kích thước, thì bạn có thể sử dụng shoes/.*/green (.* sẽ so khớp với mọi ký tự, không giới hạn số lượng).
  • Hiểu ý định của người dùng – Hãy sử dụng biểu thức chính quy để phân tích loại cụm từ tìm kiếm đang đưa người dùng đến các phần trên trang web của bạn. Ví dụ: nếu bạn quan tâm đến cụm từ tìm kiếm chứa các từ nghi vấn thì bộ lọc cụm từ tìm kiếm what|how|when|why có thể hiển thị những kết quả thể hiện rằng nội dung của bạn có thể dễ dàng trả lời câu hỏi (có thể thông qua mục Câu hỏi thường gặp). Một ví dụ khác là các cụm từ tìm kiếm chứa (hoặc không chứa) từ ngữ mang tính giao dịch, chẳng hạn như buy|purchase|order. Cách làm này cũng có thể hiển thị những tên sản phẩm thường dùng hoặc hiếm dùng trong những biểu thức đó.

Hãy truy cập trung tâm trợ giúp của Search Console để nắm được các biểu thức chính quy thông dụng. Nếu bạn có ví dụ thú vị nào về việc sử dụng biểu thức chính quy, hãy chia sẻ trên Twitter bằng hashtag #performanceregex.

Nếu bạn có câu hỏi hoặc thắc mắc, vui lòng liên hệ qua Cộng đồng Trung tâm Google Tìm kiếm hoặc qua Twitter.