bảo trì seo

Lỗi duplicate content

Có thể bạn đã gặp khá nhiều thuật ngữ trùng lặp nội dung, nhưng nó là gì? Nội dung trùng lặp là nội dung tồn tại ở một số đường dẫn – tức là URL. Nó có thể gây hại cho thứ hạng của bạn và nhiều người nói rằng số lượng lớn trùng đường dẫn thậm chí có thể dẫn đến hình phạt của Google. Tuy nhiên, điều đó không đúng. Không có hình phạt, nhưng có vô số nội dung trùng lặp hoặc sao chép có thể khiến Google ảnh hưởng tiêu cực đến thứ hạng SEO của bạn.

Nội dung trùng lặp là gì?

Nội dung trùng lặp là tất cả nội dung có sẵn trên nhiều địa điểm trong hoặc ngoài trang web của bạn. Nó thường nằm trên một URL khác và đôi khi thậm chí trên một miền khác. Nó chủ yếu xảy ra vô tình hoặc là kết quả của việc triển khai kỹ thuật phụ. Ví dụ: trang web của bạn có thể có trên cả www và không phải www hoặc HTTP và HTTPS – hoặc cả hai cùng một lúc, thật kinh dị! Hoặc có thể CMS của bạn sử dụng quá nhiều tham số URL động gây nhầm lẫn cho các công cụ tìm kiếm. Ngay cả các trang AMP của bạn cũng có thể được tính là nội dung trùng lặp nếu không được liên kết đúng cách. Nó ở khắp mọi nơi.

Định nghĩa của Google về nội dung trùng lặp như sau:

Nội dung trùng lặp thường đề cập đến các khối nội dung thực sự trong hoặc trên các domain hoàn toàn khớp với nội dung khác hoặc tương tự đáng kể. Hầu hết, đây không phải là lừa đảo về nguồn gốc.

Đó là phần cuối cùng quan trọng. Nếu bạn cóp nhặt, sao chép và quay nội dung hiện có – Google gọi đây là nội dung sao chép – với mục đích đánh lừa công cụ tìm kiếm để có được thứ hạng cao hơn, bạn sẽ ở vùng nguy hiểm.

Google cho biết loại mục đích xấu này có thể gây nên:

Nội dung trùng lặp trên một trang web không phải là cơ sở để hành động trên trang web đó trừ khi có vẻ như mục đích của nội dung trùng lặp là để lừa đảo và thao túng kết quả của công cụ tìm kiếm

Chúng có một số mẹo tuyệt vời để phát hiện nội dung trùng lặp trên trang web của bạn trong kiểm tra nội dung trùng lặp Tự làm của mình và phải làm gì nếu ai đó sao chép nội dung của bạn. Tài liệu của Google cũng là một tài liệu hay nếu bạn đang làm việc với loại nội dung này.

Nội dung trùng lặp, nội dung sao chép và nội dung mỏng: có sự khác biệt là gì?

Chủ đề về nội dung trùng lặp gây nhầm lẫn cho rất nhiều người. Đối với Google, nó chủ yếu có nguồn gốc kỹ thuật, nhưng nó cũng sẽ xem xét nội dung của chính nó. “Chúng ta có hai URL cho cùng một bài viết, google nên chọn URL nào?” Trong khi hầu hết những mọi người đều có thể sẽ nghĩ về những phần nội dung tương tự xuất hiện ở những nơi khác trên trang web. “Tôi đã sử dụng đoạn văn bản này ở một số nơi khác, điều đó có ảnh hưởng đến thứ hạng google không?” Đây là tất cả nội dung trùng lặp, nhưng để xác định thứ hạng, các công cụ tìm kiếm sẽ phân biệt giữa nội dung trùng lặp, nội dung sao chép và nội dung mỏng.

Nội dung trùng lặp của bạn có thể được phân loại là nội dung được sao chép nếu bạn sử dụng một văn bản hiện có và chuyển nó nhanh chóng để sử dụng lại trên trang web của mình. Không thành vấn đề nếu bạn xoay xở một chút hoặc thêm một vài từ khóa, hành vi này là không thể chấp nhận được. Đưa vào một vài trang nội dung mỏng – các trang có ít hoặc không có nội dung chất lượng – và bạn đang ở trong lãnh thổ nguy hiểm. Chất lượng trang web là một vấn đề và những chiến thuật này có thể gây hại nghiêm trọng cho trang web của bạn. Bạn có còn nhớ thuật toán Panda?

Không chặn nội dung trùng lặp trên trang web của bạn

Google khá giỏi trong việc phát hiện và xử lý nội dung trùng lặp. Công cụ tìm kiếm đủ thông minh để biết phải làm gì với hầu hết nội dung mà nó tìm thấy. Nếu nó tìm thấy nhiều phiên bản của một trang, nó sẽ xếp những phiên bản này thành phiên bản nó thấy tốt nhất – trong hầu hết các trường hợp, đây sẽ là bài viết / trang gốc. Tuy nhiên, những gì nó cần là quyền truy cập đầy đủ vào các URL này. Nếu bạn chặn Googlebot trong robots.txt của mình thu thập dữ liệu các URL này, nó không thể tự tìm ra những điều này và bạn sẽ gặp rủi ro khi Google coi các trang này là các bản sao riêng biệt. Dưới đây là một số điều bạn nên làm:

  • Cho phép robots.txt thu thập thông tin các URL này
  • Đánh dấu nội dung là trùng lặp bằng cách sử dụng rel = canonical (đọc thêm về điều này bên dưới)
  • Sử dụng công cụ Xử lý tham số URL của Google để xác định cách xử lý các tham số
  • Sử dụng chuyển hướng 301 để đưa người dùng và trình thu thập thông tin đến URL chuẩn
  • Bạn có thể làm nhiều việc hơn nữa để chống lại nội dung trùng lặp trên trang web của mình trong bài viết về nguyên nhân và giải pháp.

Sử dụng rel = canonical!

Một trong những công cụ thiết yếu trong bộ công cụ chống nội dung trùng lặp của bạn là rel = ”canonical”. Bạn có thể sử dụng đoạn mã này để xác định URL gốc của một phần nội dung, chúng tôi gọi là URL chuẩn. Chúng tôi có một hướng dẫn cơ bản tuyệt vời về rel = ”canonical” chỉ cho bạn mọi thứ cần biết về nó.

Tập trung vào nội dung nguyên bản, mới mẻ và có thẩm quyền

Một công cụ khác trong kho vũ khí của bạn để chống lại nội dung trùng lặp, sao chép và không nguyên bản là kỹ năng viết của bạn. Google tập trung vào chất lượng. Nó luôn chú ý đến phần nội dung tốt nhất có thể và phù hợp nhất với ý định của người dùng. Mục tiêu của bạn không phải là kiếm tiền nhanh chóng mà là để lại ấn tượng lâu dài. Chú ý nội dung mỏng và đảm bảo nội dung nguyên bản và có chất lượng cao.

Điều này cũng xảy ra với nội dung tương tự trên trang web của bạn. Trước đây chúng ta đã nói về hanibalization keyword và đây là một phần mở rộng của điều đó. Gấp nhiều bài đăng có thể so sánh thành một bài có thể đạt được kết quả tốt hơn nhiều, cả về thứ hạng cũng như chống lại nội dung trùng lặp.

Đây là cách Google sẽ tiếp nhận nội dung tương tự:

Giảm thiểu nội dung tương tự: Nếu bạn có nhiều trang giống nhau, hãy cân nhắc mở rộng từng trang hoặc hợp nhất các trang thành một. Ví dụ: nếu bạn có một trang web du lịch với các trang riêng biệt cho hai thành phố, nhưng thông tin giống nhau trên cả hai trang, bạn có thể hợp nhất các trang thành một trang về cả hai thành phố hoặc bạn có thể mở rộng mỗi trang để chứa nội dung duy nhất về mỗi thành phố.

Đọc thêm về tìm và sửa lỗi canibalization keyword

Nội dung trùng lặp ở khắp mọi nơi

Cựu Googler Matt Cutts từng nói rằng 20% ​​đến 30% web chứa nội dung trùng lặp. Mặc dù tôi không chắc những con số này vẫn chính xác; nội dung trùng lặp tiếp tục xuất hiện trên mọi trang web. Đây không phải là tin xấu. Hãy khắc phục những điều bạn có thể và không nên thử và biến nội dung trùng lặp và những nội dung tương tự, sử dụng seo copy writting để biến thành một nội dung có chất lượng, chính là công việc hằng ngày của seoler.

Đọc thêm: Bảo trì nội dung cho SEO

Quý khách có thể tham khảo hơn ở các dịch vụ do websitehcm.com cung cấp như: dịch vụ seo, dịch vụ viết content , dịch vụ chăm sóc website, thiết kế web giá rẻ

Leave a Reply