chăm sóc website

Noindex và nofollow

Noindex là gì?

Để tránh nội dung không mong muốn trong chỉ mục tìm kiếm, quản trị viên web có thể làm trình thu thập thông tin (spiders) không thu thập dữ liệu từ các tập tin hoặc thư mục nhất định thông qua tập tin robots.txt chuẩn trong thư mục gốc của miền (domain).

Ngoài ra, một trang có thể chính thức bị loại trừ khỏi cơ sở dữ liệu của công cụ tìm kiếm bằng cách sử dụng thẻ meta dành riêng cho robot (thường là <meta name = “robots” content = “noindex”>). Khi một công cụ tìm kiếm truy cập một trang web, tập tin robots.txt nằm trong thư mục gốc là tập tin đầu tiên được thu thập thông tin.

Sau đó, tập tin robots.txt sẽ được phân tích cú pháp và sẽ điều khiển robot biết trang nào không được thu thập thông tin. Vì trình thu thập thông tin của công cụ tìm kiếm có thể giữ bản sao được lưu trong bộ nhớ cache của tập tin này, nên đôi khi nó có thể thu thập thông tin các trang mà quản trị viên web không muốn thu thập thông tin.

Các trang thường bị ngăn thu thập thông tin bao gồm các trang đăng nhập cụ thể như giỏ hàng và nội dung dành riêng cho người dùng, chẳng hạn như kết quả tìm kiếm từ các tìm kiếm nội bộ.

Vào tháng 3 năm 2007, Google đã cảnh báo các quản trị viên web rằng họ nên ngăn chặn việc lập chỉ mục các kết quả tìm kiếm nội bộ vì những trang đó bị coi là spam tìm kiếm.

Nofollow là gì?

nofollow là thuộc tính của trên liên kết trang web(link) hướng các công cụ tìm kiếm không sử dụng liên kết để tính toán xếp hạng trang(page rank). Nó được chỉ định trong trang như một loại quan hệ liên kết đó là: Bởi vì các công cụ tìm kiếm thường tính toán mức độ quan trọng của một trang web theo số lượng siêu liên kết(hyper link) từ các trang web khác, cài đặt nofollow cho phép các tác giả trang web chỉ ra rằng sự hiện diện của một liên kết không phải là sự xác nhận tầm quan trọng của trang web mục tiêu.

Khái niệm và đặc điểm kỹ thuật

Giá trị nofollow ban đầu được đề xuất để ngăn chặn spam bình luận trong blog. Tin rằng spam bình luận đã ảnh hưởng đến toàn bộ cộng đồng viết blog, vào đầu năm 2005 Matt Cutts của Google và Blogger của Jason Shellen đã đề xuất giá trị để giải quyết vấn đề.

Đặc điểm kỹ thuật cho nofollow được các tác giả đăng ký bản quyền 2005–07 và tuân theo chính sách bằng sáng chế miễn phí bản quyền, ví dụ: theo Chính sách Bằng sáng chế W3C 20040205 và IETF RFC 3667 & RFC 3668.

Google đã thông báo vào đầu năm 2005 rằng các siêu liên kết với rel = “nofollow” sẽ không ảnh hưởng đến Xếp hạng Trang của mục tiêu liên kết. Ngoài ra, công cụ tìm kiếm Yahoo và Bing cũng tôn trọng giá trị thuộc tính này.

Vào ngày 15 tháng 6 năm 2009, kỹ sư phần mềm của Google, Matt Cutts, đã thông báo trên blog của mình rằng GoogleBot đã thay đổi cách nó xử lý các liên kết không có theo dõi, nhằm ngăn các quản trị viên web sử dụng nofollow để tạo PageRank.

Trước đó, quản trị viên web sẽ đặt thẻ nofollow trên một số liên kết của họ để tối đa hóa Xếp hạng trang của các trang khác. Kết quả của sự thay đổi này, việc sử dụng nofollow dẫn đến sự thay đổi của thứ hạng trang của các liên kết đi bình thường khi chúng bắt đầu đếm tổng số liên kết trong khi tính xếp hạng trang.

Hệ thống mới phân chia xếp hạng trang theo tổng số liên kết đi không phân biệt liên kết nofollow hay theo dõi, nhưng xếp hạng trang chỉ thông qua theo dõi hoặc liên kết bình thường. Cutts giải thích rằng nếu một trang có 5 liên kết bình thường và 5 liên kết đi nofollow, thứ hạng của trang sẽ được chia cho 10 liên kết và một chia sẻ được vượt qua bởi 5 liên kết bình thường. Tuy nhiên, kể từ ngày 1 tháng 3 năm 2020, Google đang coi thuộc tính liên kết nofollow như một gợi ý, thay vì một chỉ thị, cho các mục đích thu thập thông tin và lập chỉ mục.

Xem thêm kỹ thuật seo cơ bản

Quý khách có thể tham khảo hơn ở các dịch vụ do websitehcm.com cung cấp như: dịch vụ seo, dịch vụ viết content , dịch vụ chăm sóc website, thiết kế web giá rẻ

Leave a Reply