Meta robots tag: tìm hiểu & kiến thức

Meta robots tag: tìm hiểu & kiến thức

Nếu bạn sử dụng meta robots tag trên các trang của mình, bạn có thể cung cấp cho công cụ tìm kiếm hướng dẫn về cách bạn muốn chúng thu thập dữ liệu hoặc lập chỉ mục các phần của trang web. Bài viết này liệt kê tổng quan về tất cả các giá trị khác nhau mà bạn có thể có trong meta robot tag, những gì chúng làm và công cụ tìm kiếm nào hỗ trợ từng giá trị.

Các bài viết liên quan:

Các giá trị meta robot tag khác nhau

Các giá trị sau (“parameter”) có thể được đặt riêng hoặc cùng nhau trong thuộc tính nội dung của thẻ (được phân tách bằng dấu phẩy), để kiểm soát cách công cụ tìm kiếm tương tác với trang .

Dưới đây là tổng quan về những công cụ tìm kiếm nào hỗ trợ những thông số cụ thể nào trong meta robots tag.

  1. Index: cho phép các công cụ tìm kiếm thêm trang vào chỉ mục của họ để những người đang tìm kiếm có thể phát hiện ra nó. Lưu ý: Khi không có chỉ thị nào liên quan đến việc lập chỉ mục, điều này được coi là mặc định.
  2. Noindex: không cho phép các công cụ tìm kiếm thêm trang này vào chỉ mục của chúng và do đó không cho phép chúng hiển thị trong kết quả tìm kiếm. Lưu ý: Thông báo không chính thức từ Google cho thấy rằng, nếu một trang được đặt thành noindex trong một khoảng thời gian dài, nó cũng có thể được coi như thể nó cũng được đặt thành nofollow. Cơ chế chính xác của điều này là không rõ ràng và không rõ liệu các công cụ tìm kiếm khác có hoạt động tương tự hay không. 
  3. Follow: cho các công cụ tìm kiếm biết rằng nó có thể đi theo các liên kết trên trang để khám phá các trang khác. Lưu ý: Khi không có chỉ thị nào liên quan đến các liên kết sau, điều này được coi là mặc định.
  4. Nofollow: yêu cầu rô bốt của công cụ tìm kiếm (chuyển giá trị trọng số) bất kỳ liên kết nào trên trang. Lưu ý: Không rõ ràng (và không nhất quán giữa các công cụ tìm kiếm) liệu thuộc tính này có ngăn các công cụ tìm kiếm theo dõi các liên kết hay chỉ ngăn chúng gán bất kỳ giá trị trọng số nào cho các liên kết đó.
  5. None: Một phím tắt cho noindex, nofollow.
  6. All: Một lối tắt cho index, hãy follow. Lưu ý: Điều này được giả định mặc định trên tất cả các trang và không làm gì thì mặc định.
  7. Noimageindex: không cho phép các công cụ tìm kiếm lập chỉ mục hình ảnh trên trang. Lưu ý: Nếu hình ảnh được liên kết trực tiếp từ nơi khác, các công cụ tìm kiếm vẫn có thể lập chỉ mục chúng, do đó, sử dụng tiêu đề X-Robots-Tag HTTP nói chung là một ý tưởng tốt hơn.
  8. Noarchive : ngăn các công cụ tìm kiếm hiển thị bản sao được lưu trong bộ nhớ cache của trang này trong danh sách kết quả tìm kiếm của họ.
  9. Nocache : giống như noarchive, nhưng chỉ được MSN / Live sử dụng.
  10. Nosnippet : ngăn các công cụ tìm kiếm hiển thị đoạn văn bản hoặc đoạn video (tức là mô tả meta) của trang này trong kết quả tìm kiếm và ngăn chúng hiển thị bản sao được lưu trong bộ nhớ cache của trang này trong danh sách kết quả tìm kiếm của chúng. Lưu ý: Đoạn mã vẫn có thể hiển thị hình thu nhỏ của hình ảnh, trừ khi noimageindex cũng được sử dụng.
  11. Nositelinkssearchbox: Ngăn công cụ tìm kiếm hiển thị hộp tìm kiếm nội tuyến cho trang web .
  12. Nopagereadaloud : Ngăn công cụ tìm kiếm đọc to nội dung trang  qua dịch vụ / kết quả thoại.
  13. notranslate :Ngăn các công cụ tìm kiếm hiển thị bản dịch của trang trong kết quả tìm kiếm của chúng.
  14. max-snippet: [number] Đặt số lượng ký tự tối đa cho mô tả meta. Lưu ý: Việc bỏ qua thẻ này có thể dẫn đến giá trị ngụ ý là 0. Giá trị mặc định là -1 phải được đặt để ngụ ý “không có giới hạn”.
  15. max-video-preview: [number] Đặt số giây tối đa cho video trong bản xem trước. Lưu ý: Việc bỏ qua thẻ này có thể dẫn đến giá trị ngụ ý là 0. Giá trị mặc định là -1 phải được đặt để ngụ ý “không có giới hạn”.
  16. max-image-preview: [setting] Đặt kích thước hình ảnh tối đa để sử dụng trong bản xem trước (không có, tiêu chuẩn hoặc lớn). Lưu ý: Bỏ qua thẻ này có thể dẫn đến giá trị ngụ ý là không.
  17. Rating : Cho biết rằng một trang chứa tài liệu dành cho người lớn.
  18. Unavailable_after: Cho các công cụ tìm kiếm biết ngày / giờ mà sau đó họ sẽ không hiển thị nó trong kết quả tìm kiếm; một phiên bản “hẹn giờ” của noindex. Lưu ý: Phải ở định dạng RFC850 (ví dụ: Thứ Hai, 15-08-05 15:52:01 UTC).
  19. Noyaca: Ngăn đoạn mã kết quả tìm kiếm sử dụng mô tả trang từ Thư mục Yandex. Lưu ý: Chỉ được hỗ trợ bởi Yandex.
  20. Noydir: Chặn Yahoo sử dụng mô tả cho trang này trong thư mục Yahoo làm đoạn mã cho trang  trong kết quả tìm kiếm. Lưu ý: Vì Yahoo đã đóng thư mục của mình nên thẻ này không còn được dùng nữa, nhưng bạn có thể gặp nó một lần trong một thời gian.

Công cụ tìm kiếm nào hỗ trợ các giá trị meta robot tag nào?

Bảng này cho thấy công cụ tìm kiếm nào hỗ trợ giá trị nào. Lưu ý rằng tài liệu được cung cấp bởi một số công cụ tìm kiếm rất thưa thớt, vì vậy có rất nhiều ẩn số.

Robots value Google Yahoo Bing Ask Baidu Yandex
Indexing controls
index Y* Y* Y* ? Y Y
noindex Y Y Y ? Y Y
noimageindex Y N N ? N N
Whether links should be followed
follow Y* Y* Y* ? Y Y
nofollow Y Y Y ? Y Y
none Y ? ? ? N Y
all Y ? ? ? N Y
Snippet/preview controls
noarchive Y Y Y ? Y Y
nocache N N Y ? N N
nosnippet Y N Y ? N N
nositelinkssearchbox Y N N N N N
nopagereadaloud Y N N N N N
notranslate Y N N ? N N
max-snippet:[number] Y Y N N N N
max-video-preview:[number] Y Y N N N N
max-image-preview:[setting] Y Y N N N N
Miscellaneous
rating Y N N N N N
unavailable_after Y N N ? N N
noodp N Y** Y** ? N N
noydir N Y** N ? N N
noyaca N N N N N Y

Quy tắc cho các công cụ tìm kiếm cụ thể

Đôi khi, bạn có thể muốn cung cấp hướng dẫn cụ thể cho một công cụ tìm kiếm cụ thể, nhưng không cung cấp cho những người khác. Hoặc bạn có thể muốn cung cấp các hướng dẫn hoàn toàn khác cho các công cụ tìm kiếm khác nhau.

Trong những trường hợp này, bạn có thể thay đổi giá trị của thuộc tính nội dung thành một công cụ tìm kiếm cụ thể (ví dụ: googlebot).

Lưu ý: Do các công cụ tìm kiếm sẽ đơn giản bỏ qua các hướng dẫn mà chúng không hỗ trợ hoặc không hiểu, nên rất hiếm khi cần sử dụng nhiều meta robot tag để đặt hướng dẫn cho các trình thu thập thông tin cụ thể.

Các tham số và tệp robots.txt

Điều quan trọng cần nhớ là meta robot tag hoạt động khác với hướng dẫn trong tệp robots.txt ,và các quy tắc xung đột có thể gây ra các hành vi không mong muốn. Ví dụ: các công cụ tìm kiếm sẽ không thể nhìn thấy các thẻ meta  nếu trang bị chặn qua robots.txt.

Bạn cũng nên cẩn thận để tránh đặt các giá trị xung đột trong meta robot tag của mình (chẳng hạn như sử dụng cả thông số chỉ mục và ngăn lập chỉ mục) – đặc biệt nếu bạn đang đặt các quy tắc khác nhau cho các công cụ tìm kiếm khác nhau. Trong các trường hợp xung đột, cách giải thích hạn chế nhất thường được chọn (nghĩa là “không hiển thị” thường hơn “hiển thị”).

Thêm noindex hoặc nofollow vào bài đăng hoặc trang thật dễ dàng nếu bạn đang sử dụng WordPress. Đọc cách sử dụng Yoast SEO để giữ một bài đăng không có trong kết quả tìm kiếm.

Kết luận:

Meta robot tag là một trong những công cụ tuyệt vời, hiểu và sử dụng tốt meta robots tag có thể giúp chúng ta làm được nhiều việc. 

Bài viết là một khía cạnh chúng tôi đã tìm hiểu được về Meta robots tag, hi vọng các bạn đã có cái nhìn tổng quan và cách sử dụng công cụ tuyệt vời này.

Xem thêm kỹ thuật seo cơ bản

Quý khách có thể tham khảo hơn ở các dịch vụ do websitehcm.com cung cấp như: dịch vụ seo, dịch vụ viết content , dịch vụ chăm sóc website, dịch vụ thiết kế website 

Leave a Reply