Những thẻ đặc biệt mà Google hiểu được

Google hỗ trợ cả thẻ meta ở cấp độ trang cũng như các lệnh cùng dòng nhằm giúp kiểm soát cách những trang thuộc trang web của bạn sẽ xuất hiện trên Google Tìm kiếm.

Thẻ meta cấp độ trang là một cách rất hay để chủ sở hữu trang web cung cấp thông tin về trang web của họ cho công cụ tìm kiếm. Bạn có thể dùng thẻ meta để cung cấp thông tin cho mọi loại ứng dụng. Mỗi hệ thống chỉ xử lý những thẻ meta mà hệ thống đó hiểu được và bỏ qua các thẻ meta còn lại. Thẻ meta được thêm vào phần <head> của trang HTML và thường có dạng như sau:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <meta name="Description" CONTENT="Author: A.N. Author, Illustrator: P. Picture, Category: Books, Price:  £9.24, Length: 784 pages">
    <meta name="google-site-verification" content="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/>
    <title>Example Books - high-quality used books for children</title>
    <meta name="robots" content="noindex,nofollow">
  </head>
</html>

Google có thể hiểu những thẻ meta sau (danh sách này không đầy đủ):

Thẻ meta mà Google hiểu được
<meta name="description" content="A description of the page" /> Hãy dùng thẻ này để cung cấp đoạn mô tả ngắn về trang. Trong một số trường hợp, Google sẽ dùng đoạn mô tả này trong đoạn trích hiển thị trên kết quả tìm kiếm.
<meta name="robots" content="..., ..." />

<meta name="googlebot" content="..., ..." />

Những thẻ meta này kiểm soát hành vi của công cụ tìm kiếm khi thu thập dữ liệu và lập chỉ mục.

Thẻ <meta name="robots"> áp dụng cho mọi công cụ tìm kiếm, còn thẻ <meta name="googlebot"> chỉ dành riêng cho Google.

Trong trường hợp các thẻ meta robots (hoặc googlebot) xung đột với nhau, thì thẻ nào có phạm vi hạn chế cao hơn sẽ được áp dụng. Ví dụ: Nếu một trang có cả thẻ max-snippet:50nosnippet, thì thẻ nosnippet sẽ được áp dụng.

Giá trị mặc định là index, follow và bạn không cần chỉ định. Để nắm được danh sách đầy đủ các giá trị mà Google hiểu được, bạn hãy xem danh sách các lệnh hợp lệ.

Bạn cũng có thể chỉ định thông tin này trong tiêu đề của trang bằng cách dùng lệnh "X-Robots-Tag" trong tiêu đề HTTP. Cách này đặc biệt hữu ích khi bạn muốn hạn chế việc lập chỉ mục các tệp không phải HTML như tệp đồ họa hoặc các loại tài liệu khác. Tìm hiểu thêm về thẻ meta robots

<meta name="google" content="nositelinkssearchbox" /> Khi người dùng tìm kiếm trang web của bạn, kết quả trên Google Tìm kiếm đôi khi hiển thị một hộp tìm kiếm riêng cho trang web của bạn, kèm theo các đường liên kết trực tiếp khác đến trang web của bạn. Thẻ này yêu cầu Google không hiển thị hộp tìm kiếm cho đường liên kết trang web. Tìm hiểu thêm về hộp tìm kiếm cho đường liên kết trang web.
<meta name="google" content="notranslate" /> Khi nhận ra nội dung của một trang không dùng ngôn ngữ mà có khả năng người dùng muốn đọc thì Google thường cung cấp một đường liên kết đến bản dịch trong kết quả tìm kiếm. Nhìn chung, tính năng này giúp bạn cung cấp nội dung hấp dẫn và độc đáo của mình tới một nhóm người dùng lớn hơn nhiều. Tuy nhiên, bạn có thể không muốn dùng tính năng này trong một số trường hợp. Thẻ meta này cho Google biết rằng bạn không muốn chúng tôi cung cấp bản dịch cho trang này.
<meta name="google" content="nopagereadaloud" /> Ngăn không cho các trình duyệt web đọc thành tiếng trang được gắn thẻ bằng lệnh thoại "Đọc trang này" và "Đọc" trong Trợ lý Google.
<meta name="google-site-verification" content="..." /> Bạn có thể sử dụng thẻ này trên trang cấp cao nhất của trang web của bạn để xác minh quyền sở hữu trên Search Console. Xin lưu ý rằng mặc dù các giá trị của thuộc tính namecontent phải hoàn toàn khớp với thông tin cung cấp cho bạn (kể cả chữ hoa và chữ thường), thì việc bạn thay đổi thẻ từ XHTML sang HTML hay định dạng của thẻ có khớp với định dạng của trang hay không đều không quan trọng.
<meta http-equiv="Content-Type" content="...; charset=..." />
<meta charset="..." >
Thẻ này xác định loại nội dung và bộ ký tự của trang. Hãy đảm bảo rằng bạn đưa giá trị của thuộc tính nội dung vào trong ngoặc kép. Nếu không, thuộc tính bộ ký tự có thể bị diễn giải sai. Bạn nên dùng Unicode/UTF-8 khi có thể. Thông tin khác.
<meta http-equiv="refresh" content="...;url=..." /> Thẻ này đưa người dùng tới một URL mới sau một khoảng thời gian nhất định và đôi khi có vai trò là một hình thức chuyển hướng đơn giản. Tuy nhiên, một số trình duyệt không hỗ trợ thẻ này và người dùng có thể thấy khó hiểu. W3C khuyến cáo không nên sử dụng thẻ này. Thay vào đó, bạn nên dùng lệnh chuyển hướng 301 phía máy chủ.
<meta name="viewport" content="..."> Thẻ này thông báo cho trình duyệt biết cách hiển thị một trang trên thiết bị di động. Bạn dùng thẻ này khi muốn cho Google biết rằng trang này thân thiện với thiết bị di động. Tìm hiểu thêm về cách định cấu hình thẻ meta cửa sổ xem.

<meta name="rating" content="adult" />

<meta name="rating" content="RTA-5042-1996-1400-1577-RTA" />

Hãy gắn nhãn một trang là có chứa nội dung người lớn để thông báo rằng trang này cần được lọc trong kết quả của Tìm kiếm an toàn. Tìm hiểu thêm về cách gắn nhãn các trang Tìm kiếm an toàn.

Các điểm khác cần lưu ý

  • Google có thể đọc cả thẻ meta dạng HTML và XHTML, bất kể trang sử dụng mã nào.
  • Ngoại trừ thẻ google-site-verification, các thẻ meta thường không phân biệt chữ hoa chữ thường.
  • Đây không phải là danh sách chứa tất cả thẻ meta hiện có. Bạn có thể sử dụng các thẻ meta khác nếu những thẻ đó có vai trò quan trọng đối với trang web của bạn. Tuy nhiên, bạn nên lưu ý rằng Google sẽ bỏ qua những thẻ meta mà Google không hiểu được.

Lệnh cùng dòng

Ngoài các thẻ meta cấp độ trang, bạn có thể yêu cầu Google không dùng một số phần của một trang HTML để tạo đoạn trích. Bạn có thể thực hiện việc này bằng cách dùng thuộc tính HTML data-nosnippet trong các phần tử HTML span, div hoặc section. Ví dụ:

<p>This text can be included in a snippet <span data-nosnippet>and this part would not be shown</span>.</p>

Để đảm bảo máy đọc được thì phần này phải là một phần tử HTML hợp lệ và bạn phải đóng chính xác tất cả các thẻ.