Những thẻ đặc biệt mà Google hiểu được

Google hỗ trợ cả thẻ meta ở cấp độ trang cũng như các lệnh cùng dòng nhằm giúp kiểm soát cách những trang thuộc trang web của bạn sẽ xuất hiện trên Google Tìm kiếm.

Thẻ meta cấp độ trang là một cách rất hay để chủ sở hữu trang web cung cấp thông tin về trang web của họ cho công cụ tìm kiếm. Bạn có thể dùng thẻ meta để cung cấp thông tin cho mọi loại ứng dụng. Mỗi hệ thống chỉ xử lý những thẻ meta mà hệ thống đó hiểu được và bỏ qua các thẻ meta còn lại. Thẻ meta được thêm vào phần <head> của trang HTML và thường có dạng như sau:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <meta name="Description" CONTENT="Author: A.N. Author, Illustrator: P. Picture, Category: Books, Price:  £9.24, Length: 784 pages">
    <meta name="google-site-verification" content="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/>
    <title>Example Books - high-quality used books for children</title>
    <meta name="robots" content="noindex,nofollow">
  </head>
</html>

Google có thể hiểu những thẻ meta sau (danh sách này không đầy đủ):

Thẻ meta mà Google hiểu được
<meta name="description" content="A description of the page" /> Hãy dùng thẻ này để cung cấp đoạn mô tả ngắn về trang. Trong một số trường hợp, Google sẽ dùng đoạn mô tả này trong đoạn trích hiển thị trên kết quả tìm kiếm.
<meta name="robots" content="..., ..." />

<meta name="googlebot" content="..., ..." />

Những thẻ meta này kiểm soát hành vi của công cụ tìm kiếm khi thu thập dữ liệu và lập chỉ mục.

Thẻ <meta name="robots"> áp dụng cho mọi công cụ tìm kiếm, còn thẻ <meta name="googlebot"> chỉ dành riêng cho Google.

Trong trường hợp các thẻ meta robots (hoặc googlebot) xung đột với nhau, thì thẻ nào có phạm vi hạn chế cao hơn sẽ được áp dụng. Ví dụ: nếu một trang có cả thẻ max-snippet:50nosnippet, thì thẻ nosnippet sẽ được áp dụng.

Giá trị mặc định là "index, follow" và không cần bạn chỉ định. Chúng tôi hiểu được những giá trị sau (khi chỉ định nhiều giá trị, hãy phân cách bằng dấu phẩy):

  • index – Cho phép lập chỉ mục trang.
  • follow – Đi theo mọi đường liên kết trên trang trong quá trình thu thập dữ liệu.
  • noindex – Ngăn không cho lập chỉ mục trang.
  • nofollow – Đừng đi theo các đường liên kết từ trang này trong quá trình thu thập dữ liệu.
  • nosnippet – Đừng hiển thị đoạn trích văn bản hay đoạn xem trước video trong kết quả tìm kiếm. Đối với video, một hình ảnh tĩnh sẽ hiển thị trong trường hợp này (nếu có thể). Ví dụ: <meta name="robots" content="nosnippet">
  • max-snippet:[number] – Giới hạn độ dài đoạn trích văn bản cho trang này ở mức [số] ký tự; chỉ định 0 để không hiển thị đoạn trích hoặc -1 để cho phép Google chọn độ dài đoạn trích mà Google cho là hiệu quả nhất để giúp người dùng khám phá nội dung của bạn và hướng người dùng đến trang web của bạn.
  • max-image-preview:[size] – Giới hạn kích thước của mọi hình ảnh được liên kết với trang này. [kích thước] có thể là "none" (không có), "standard" (tiêu chuẩn) hoặc "large" (lớn).
  • max-video-preview:[number] – Giới hạn thời lượng của mọi đoạn xem trước video được liên kết với trang này ở mức [number] giây; chỉ định 0 để chỉ cho phép hình ảnh tĩnh hoặc -1 để cho phép thời lượng bất kỳ cho đoạn xem trước.
  • noarchive – Đừng hiển thị đường liên kết được lưu vào bộ nhớ đệm cho một trang trong kết quả tìm kiếm.
  • unavailable_after:[date] – Cho phép bạn chỉ định chính xác ngày và giờ mà bạn muốn dừng hoạt động thu thập dữ liệu và dừng hoạt động lập chỉ mục đối với trang này.
  • noimageindex – Đừng hiển thị trang này dưới dạng trang giới thiệu cho một hình ảnh trong kết quả của Google Hình ảnh. Cách này có tác dụng chặn hoạt động lập chỉ mục đối với mọi hình ảnh trên trang. Nếu một hình ảnh còn xuất hiện trên một trang khác, Google có thể thu thập dữ liệu và lập chỉ mục hình ảnh đó theo các quyền trên trang đó. Hãy lưu ý rằng đây chưa phải là một tiêu chuẩn trên Internet. Cách chuẩn để chặn hình ảnh là sử dụng quy tắc trong tệp robots.txt.
  • none – Tương đương với noindex, nofollow.
  • all - [Mặc định] Tương đương với "index, follow".

Bạn cũng có thể chỉ định thông tin này trong tiêu đề của trang bằng cách dùng lệnh "X-Robots-Tag" trong tiêu đề HTTP. Cách này đặc biệt hữu ích khi bạn muốn hạn chế việc lập chỉ mục các tệp không phải HTML như tệp đồ họa hoặc các loại tài liệu khác. Tìm hiểu thêm về thẻ meta robots

<meta name="google" content="nositelinkssearchbox" /> Khi người dùng tìm kiếm trang web của bạn, kết quả trên Google Tìm kiếm đôi khi hiển thị một hộp tìm kiếm riêng cho trang web của bạn, kèm theo các đường liên kết trực tiếp khác đến trang web của bạn. Thẻ này yêu cầu Google không hiển thị hộp tìm kiếm cho đường liên kết trang web. Tìm hiểu thêm về hộp tìm kiếm cho đường liên kết trang web.
<meta name="google" content="notranslate" /> Khi nhận ra nội dung của một trang không dùng ngôn ngữ mà có khả năng người dùng muốn đọc thì Google thường cung cấp một đường liên kết đến bản dịch trong kết quả tìm kiếm. Nhìn chung, tính năng này giúp bạn cung cấp nội dung hấp dẫn và độc đáo của mình tới một nhóm người dùng lớn hơn nhiều. Tuy nhiên, bạn có thể không muốn dùng tính năng này trong một số trường hợp. Thẻ meta này cho Google biết rằng bạn không muốn chúng tôi cung cấp bản dịch cho trang này.
<meta name="google" content="nopagereadaloud" /> Ngăn không cho các trình duyệt web đọc thành tiếng trang được gắn thẻ bằng lệnh thoại "Đọc trang này" và "Đọc" trong Trợ lý Google.
<meta name="google-site-verification" content="..." /> Bạn có thể sử dụng thẻ này trên trang cấp cao nhất của trang web của bạn để xác minh quyền sở hữu trên Search Console. Xin lưu ý rằng mặc dù các giá trị của thuộc tính namecontent phải hoàn toàn khớp với thông tin cung cấp cho bạn (kể cả chữ hoa và chữ thường), thì việc bạn thay đổi thẻ từ XHTML sang HTML hay định dạng của thẻ có khớp với định dạng của trang hay không đều không quan trọng.
<meta http-equiv="Content-Type" content="...; charset=..." />
<meta charset="..." >
Thẻ này xác định loại nội dung và bộ ký tự của trang. Hãy đảm bảo rằng bạn đưa giá trị của thuộc tính nội dung vào trong ngoặc kép. Nếu không, thuộc tính bộ ký tự có thể bị diễn giải sai. Bạn nên dùng Unicode/UTF-8 khi có thể. Thông tin khác.
<meta http-equiv="refresh" content="...;url=..." /> Thẻ này đưa người dùng tới một URL mới sau một khoảng thời gian nhất định và đôi khi có vai trò là một hình thức chuyển hướng đơn giản. Tuy nhiên, một số trình duyệt không hỗ trợ thẻ này và người dùng có thể thấy khó hiểu. W3C khuyến cáo không nên sử dụng thẻ này. Thay vào đó, bạn nên dùng lệnh chuyển hướng 301 phía máy chủ.
<meta name="viewport" content="..."> Thẻ này thông báo cho trình duyệt biết cách hiển thị một trang trên thiết bị di động. Bạn dùng thẻ này khi muốn cho Google biết rằng trang này thân thiện với thiết bị di động. Tìm hiểu thêm về cách định cấu hình thẻ meta cửa sổ xem.

<meta name="rating" content="adult" />

<meta name="rating" content="RTA-5042-1996-1400-1577-RTA" />

Hãy gắn nhãn một trang là có chứa nội dung người lớn để thông báo rằng trang này cần được lọc trong kết quả của Tìm kiếm an toàn. Tìm hiểu thêm về cách gắn nhãn các trang Tìm kiếm an toàn.

Các điểm khác cần lưu ý

  • Google có thể đọc cả thẻ meta dạng HTML và XHTML, bất kể trang sử dụng mã lập trình nào.
  • Ngoại trừ thẻ google-site-verification, các thẻ meta thường không phân biệt chữ hoa chữ thường.
  • Danh sách này không chứa đầy đủ mọi thẻ meta hiện có. Bạn có thể dùng các thẻ meta khác nếu các thẻ đó có ý nghĩa quan trọng với trang web của bạn. Tuy nhiên, bạn nên lưu ý rằng Google sẽ bỏ qua những thẻ meta mà Google không hiểu được.

Lệnh cùng dòng

Ngoài các thẻ meta cấp độ trang, bạn có thể yêu cầu Google không dùng một số phần của một trang HTML để tạo đoạn trích. Bạn có thể thực hiện việc này bằng cách dùng thuộc tính HTML data-nosnippet trong các phần tử HTML span, div hoặc section. Ví dụ:

<p>This text can be included in a snippet <span data-nosnippet>and this part would not be shown</span>.</p>

Để đảm bảo máy đọc được thì phần này phải là một phần tử HTML hợp lệ và bạn phải đóng chính xác tất cả các thẻ.