Lỗi 404, kiểm tra và sửa lỗi

Lỗi 404, kiểm tra và sửa lỗi

Rate this post

Nếu trang web của bạn quan trọng đối với doanh nghiệp của bạn, điều cần thiết là phải lên lịch thời gian để duy trì hoạt động trơn tru. Do đó, chúng ta cần thường xuyên viết về những điều bạn nên làm để giữ cho trang web của mình hoạt động tốt. Trong bài đăng này, chúng tôi sẽ viết về điều cơ bản nhất: kiểm tra lỗi 404.

Lưu ý: bài đăng này không bao gồm các yếu tố bắt buộc của một trang 404 tốt, tuy nhiên, chúng tôi có một bài về điều đó, mặc dù: Suy nghĩ về trang lỗi 404.

Các bài viết liên quan:

Tóm tắt nội dung

Lỗi 404 là gì?

Lỗi 404 (HTTP 404), còn được gọi là “mã phản hồi tiêu đề” hoặc “mã trạng thái http”, hoặc đơn giản là “lỗi thu thập thông tin”, máy tính tương đương với việc nói “Không tìm thấy” hoặc “Không tìm thấy trang”.

Đây là định nghĩa “nói về công nghệ”:

“Máy chủ không tìm thấy tài nguyên nào phù hợp với đường dẫn url. Không tình trạng này là tạm thời hay vĩnh viễn. 

Code status 410 (Gone) NÊN được sử dụng trong trường hợp này, thông qua trạng thái này có thể cho biết rằng tài nguyên không có khả năng sử dụng và cung cấp. 

Mã trạng thái này thường được sử dụng khi máy chủ không muốn tiết lộ chính xác lý do tại sao yêu cầu bị từ chối hoặc khi không có phản hồi nào khác được áp dụng ”.- qua w3.org

Nói cách khác (ít kỹ thuật hơn), mã phản hồi này về cơ bản cho các công cụ tìm kiếm – và người dùng – biết rằng tài nguyên (hoặc URL được yêu cầu) đang được tham chiếu không tồn tại hoặc không thể tìm thấy theo nghĩa đen.Đó là phiên bản của rô-bốt có kiểu dáng nhún vai và trống rỗng.

Có nhiều loại lỗi phản hồi khác và tất cả các URL đều trả về mã phản hồi thuộc một số loại. Ví dụ: một trang hoạt động chính xác sẽ trả về mã trạng thái “200”, có nghĩa là “Đã tìm thấy”. 

Loại lỗi chính khác được gọi là “lỗi máy chủ”, được biểu thị bằng mã trạng thái HTTP 500-599. Các loại lỗi khác nhau giúp quản trị viên web chẩn đoán nguồn gốc của lỗi để họ có thể sửa chữa nó một cách thích hợp.

Lỗi 404 thường là loại lỗi phổ biến nhất. Chúng cũng thường được xử lý không chính xác bởi những người có thiện chí – do đó mục đích của việc viết bài này! Lỗi HTTP 404 đôi khi được gọi là “Lỗi máy khách”, trong đó “máy khách” thường đề cập đến trình duyệt web của người dùng (Google Chrome, IE, Firefox, v.v.)Các lỗi từ 400 đến 499 đều là Lỗi máy khách.

Một số lỗi 4xx phổ biến khác bao gồm:

  • 400 (Yêu cầu không hợp lệ)
  • 401 (Trái phép)
  • 403 (Bị cấm) – lỗi này thường xảy ra khi bạn thu thập dữ liệu một trang web quá nhanh và nền tảng / máy chủ (ví dụ: Shopify!) Sẽ từ chối bạn truy cập để giảm tải máy chủ web của họ.

Xem thêm Phản hồi mã http

Soft 404 là gì?

Soft 404 về cơ bản là một trang không trả lại mã phản hồi 404, nhưng Google (bot) vẫn tin rằng trang đang gặp lỗi.

Bạn có thể tìm hiểu xem Google có tin rằng bất kỳ trang nào trên trang web của bạn là soft 404 hay không thông qua Báo cáo mức độ phù hợp, trong phần “Bị loại trừ” của Google Search Console. 

Đôi khi những trang này là tốt, các trang chức năng và Google đã mắc lỗi.

Tuy nhiên, thường xuyên hơn, chúng là các trang trống / không có nội dung – nhưng chúng không cấp mã trạng thái 404 thích hợp (giống như chúng nên như vậy).

Sự khác biệt giữa 404s và 404s mềm là gì?

Chúng ta có thể giữ cái này ngắn gọn và dễ hiểu – về cơ bản, soft 404 không cấp mã trạng thái tiêu đề 404; thay vào đó, nó (có lẽ không chính xác) đưa ra mã trạng thái 200 (Được).

Trang 404 thích hợp cấp đúng mã trạng thái HTTP 404 (Không tìm thấy trang).

Một số vấn đề về 404 error

Lỗi 404 xảy ra như thế nào và khi nào?

Khi các trang đã được di chuyển (ví dụ: một trang bị thiếu, có thể do nó được chuyển đến một phần khác trên trang web của bạn) hoặc bị xóa (ví dụ: một trang không tồn tại hoặc đã bị xóa bị lãng quên và không bao giờ được chuyển hướng)

Khi quản trị viên web, người dùng CMS hoặc kỹ sư phần mềm nhập nhầm URL trên một trang hoặc “mẫu trang” hoặc có lỗi sao chép và dán (ví dụ: url sai được liên kết với)

Khi các liên kết bị hỏng hoặc liên kết bị cắt xén vô tình xảy ra trên các trang web, bài đăng trên mạng xã hội hoặc trong một email

Các soft 404 thực sự xảy ra khi một trang đưa ra trạng thái 200 (OK) khi mà lẽ ra trang đó đã xuất hiện một số lỗi khác, vì đã xảy ra sự cố. Thông thường nhất, trang web đáng lẽ đã phát ra lỗi 404, nhưng không phải vậy. Thông thường, đây là dấu hiệu cho thấy 404 không hoạt động bình thường. Đôi khi nó hoạt động ở một số phần trên trang web của bạn, nhưng không hoạt động ở một số phần khác.

Xem thêm Hướng dẫn kiểm tra kỹ thuật SEO chuyên sâu

Các trang 404 hữu ích như thế nào?

Lỗi 404 cho các công cụ tìm kiếm, khách truy cập trang web và quản trị viên web biết khi nào URL trang bị hỏng hoặc không bao giờ tồn tại ngay từ đầu.

Khi chúng tôi có thể thấy những mã lỗi này xảy ra ở đâu, chúng tôi có thể khắc phục sự cố cho những khách truy cập trang web trong tương lai (thường thông qua chuyển hướng 301 đến vị trí mới của nội dung đó), do đó duy trì sức mạnh của trang đã từng tồn tại (… hoặc liên kết không chính xác đến một trang chưa từng có. Đó là những gì chúng tôi gọi là “xây dựng liên kết ngược bị hỏng”.)

Nếu bạn không phát hành mã phản hồi 404, bạn sẽ không biết rằng trang – và do đó người dùng – đang gặp lỗi.

Vì vậy, CÓ. Trang 404 rất hữu ích.

Lỗi 404 có hại cho tối ưu hóa công cụ tìm kiếm (SEO) không? Các lỗi 404 có tốt cho SEO không?‍

Có một số bất đồng trên mạng tranh luận về vấn đề này.

Về lý thuyết, ít nhất, lỗi 404 là “xấu” vì chúng đại diện cho các lỗi trên trang web của bạn (hoặc trên web, nhưng liên quan đến trang web của bạn). Nhưng những sai lầm vẫn xảy ra, và chúng dễ dàng được tha thứ ở quy mô nhỏ.

Điều đó nói rằng, người dùng xem qua trang 404 ít có khả năng quay lại trang đó sau đó. (Chúng tôi sẽ trình bày cách làm cho điều này ít xảy ra hơn, bên dưới.)

Quá nhiều lỗi phản hồi tiêu đề 404 – hoặc 403, 500 hoặc thực sự là bất kỳ loại lỗi 4 {xx} hoặc 5 {xx} nào khác – trên một trang web có thể tạo ra tỷ lệ lỗi tổng thể cao so với tỷ lệ thành công.

Điều này dẫn đến các vấn đề về độ tin cậy: nếu Google thấy quá nhiều lỗi so với các trang chức năng, họ sẽ không muốn đưa người dùng đến trang web của bạn. Tại sao họ sẽ? Người dùng đó sẽ bị lạc và phát điên, và có trải nghiệm tồi tệ. Điều đó có nghĩa là Google đã thất bại trong công việc của họ – giúp người dùng nhanh chóng và dễ dàng tìm thấy câu trả lời cho câu hỏi của họ.

Nếu trang web của bạn đang tích cực liên kết đến một loạt các trang không có chức năng, điều đó có nghĩa là bạn đang vượt qua “thứ hạng trang” (ví dụ: vốn chủ sở hữu SEO)… không có gì. Hình ảnh tình huống trong đó trang web của bạn giống như một chiếc ví có lỗ trong đó, với tiền nhỏ giọt. Không có bueno!

Điều đó nói rằng – lỗi 404 có thể và sẽ xảy ra bất kể điều gì. Trang 404 hoạt động bình thường sẽ thông báo cho quản trị viên web rằng lỗi đã xảy ra và lỗi xảy ra ở đâu. Sau đó, chúng tôi có thể sửa nó thông qua chuyển hướng 301 (vĩnh viễn). Người dùng và các công cụ tìm kiếm không bao giờ cần phải gặp lại vấn đề cụ thể này nữa.

Điểm mấu chốt: Một số nhóm coi 404 là “xấu” và do đó, tránh “tính xấu” cố hữu này bằng cách chọn không cấp mã trạng thái 404 trên trang 404. Vấn đề là – những lỗi mà người dùng thực đang gặp phải có thể và sẽ xảy ra bất kể điều gì. Đừng “bắn người đưa tin” – những sai lầm vẫn xảy ra và mã lỗi giúp chúng tôi xác định những lỗi đó! Việc cấp mã trạng thái 404 chính xác có nghĩa là bạn có thể dễ dàng tìm thấy các vấn đề để khắc phục chúng.

Xem thêm Các yếu tố quan trọng làm giảm thứ hạng SEO

Chức năng của trang 404 như thế nào? (Vấn đề Trải nghiệm Người dùng!)

Bước 1: Giữ nguyên tại URL đã được gọi, (ví dụ: https://www.thegray.company/i-made-this-up/) – ví dụ: ĐỪNG chuyển hướng trang này đến một số trang khác như /404.html. Lỗi sẽ tải trên URL có lỗi, vì vậy chúng tôi có thể thấy lỗi – nơi nó xảy ra – và do đó sửa nó đúng cách.

Bước 2: Một “lỗi trạng thái http” 404 sẽ được phát hành từ máy chủ. Sử dụng một công cụ như httpstatus.io để kiểm tra lại xem nó có đang hoạt động hay không.

Bước 3: Thông báo 404 – hiển thị cho khách truy cập trang web, trên trang – phải giải thích rõ ràng những gì đã xảy ra và bao gồm các tài nguyên, liên kết và lý tưởng là khả năng tìm kiếm trang web của bạn để tìm thấy những gì họ đang tìm kiếm.

Các thiết lập không phù hợp phổ biến nhất cho các trang 404 là gì? Lỗi / Lỗi Thiết lập 404 Phổ biến nhất là gì?

Chuyển hướng đến trang 404. Điều này làm đau lòng tất cả mọi người. Người dùng bị mất, các công cụ tìm kiếm nghĩ rằng mọi thứ là honky-dory khi nó không xảy ra và vì bạn không biết khi nào nó xảy ra – bạn không thể sửa chữa nó. 

Tự động chuyển hướng đến trang mà bạn cho là công cụ tìm kiếm và người dùng muốn. Một giải pháp rủi ro, có thể dễ dàng xảy ra sai sót (thường là vì chúng được gửi đến nội dung không liên quan – như trang chủ của bạn.)  Tốt nhất là không nên giả định. Tìm vấn đề và khắc phục nó.

Cung cấp thông báo 404 trên trang một cách trực quan, nhưng không gửi mã phản hồi 404 http tương ứng. Điều này làm tổn thương tất cả mọi người (vì lý do tương tự như mục “chuyển hướng đến trang 404” ở trên.)

Cung cấp mã trạng thái khác cho các tác nhân người dùng khác nhau. Ví dụ: bạn đang gửi cho Bingbot một tin nhắn 404 (không tìm thấy) và người dùng trong trình duyệt một tin nhắn 200 (được)? Đôi khi điều này xảy ra trên các thiết bị khác nhau, ví dụ: có 404 trên điện thoại di động (và cho Googlebot-Mobile) nhưng không có trên trình duyệt máy tính để bàn.

Không tìm thấy và giải quyết các lỗi nghiêm trọng – một cách thường xuyên. Kỹ thuật các nhóm bận rộn – và họ không muốn làm thêm việc, vì vậy không có gì lạ khi họ từ chối làm việc đó. Nhất là khi họ chưa hiểu hết giá trị của tác phẩm đối với doanh nghiệp. ‍Các SPA (Ứng dụng Trang Đơn) không thể tạo 404 “ra khỏi hộp” thích hợp. Đây là cách chính xác để khắc phục điều đó.

Hậu quả SEO của Sai lầm thiết lập 404 là gì?

Nếu có quá nhiều lỗi 404 xảy ra trên trang web, thì bản thân URL 404 có thể bắt đầu xếp hạng (sự cố xảy ra khi bạn kết hợp chuyển hướng đến trang 404 với một URL không đưa ra phản hồi tiêu đề 404 http thích hợp).

Các trang trên trang web nên được hưởng lợi từ liên kết thì không, làm giảm tiềm năng xếp hạng tổng thể của công cụ tìm kiếm. Điều này dẫn đến ít lưu lượng truy cập vào trang web hơn.

Người dùng nhìn thấy trang 404 – thay vì trang mà họ nên xem – thường khiến họ rời đi.

Rất tiếc, những người dùng này không có khả năng quay lại:

Các trang 404 có tỷ lệ thoát cao – tức là tỷ lệ khách truy cập vào trang này đầu tiên (thường thông qua công cụ tìm kiếm) và ngay lập tức rời khỏi trang web.

Các trang 404 có tỷ lệ thoát cao – tức là tỷ lệ khách truy cập tìm thấy trang này từ việc nhấp vào liên kết ở đâu đó trên trang web của bạn, sau đó họ rời đi ngay lập tức.

Xem thêm Cách tạo redirect 301

Làm cách nào để trang 404 của tôi trở nên thân thiện hơn với người dùng? (Ví dụ: Các phương pháp hay nhất về trang 404 là gì)?

Có một số điều bạn có thể làm để cải thiện trang 404 của trang web – và khả năng khách truy cập trang web sẽ theo dõi và xem phần còn lại của trang web – bao gồm:

Giải thích bằng tiếng Anh đơn giản (hoặc bất kỳ ngôn ngữ nào mà trang web của bạn nhắm mục tiêu), chính xác điều gì đã xảy ra. Điều này là vì lợi ích của người dùng…. bởi vì điều đó quan trọng!

Bao gồm một liên kết đến trang liên hệ của bạn để người dùng có thể cố gắng giải quyết vấn đề với sự trợ giúp của bạn. Bao gồm một sơ đồ trang web HTML được đơn giản hóa (được nhúng trong phần nội dung của trang) để người dùng có thể tìm ra cách riêng của họ.

 Theo dõi những gì đang được tìm kiếm thường xuyên nhất và làm cho những tài nguyên đó dễ tìm hơn.

Cân nhắc thêm thanh tìm kiếm vào mẫu trang 404 – để người dùng có thể tìm kiếm tài nguyên nếu họ chưa thấy danh sách.

Đảm bảo tiêu đề của mẫu 404 bao gồm văn bản “404” hoặc “Không tìm thấy trang” – bằng cách này, bạn có thể tìm ra trang nào mà khách truy cập trang web của bạn đang truy cập và tần suất điều này xảy ra, trong Google Analytics (hoặc công cụ theo dõi phân tích của bạn sự lựa chọn.)

Hãy vui vẻ với nó! Mở rộng tính cách thương hiệu của bạn và kết nối với khán giả của bạn.

Xem thêm Phương pháp kiểm tra Link(liên kết) nội bộ

Cách sửa lỗi 404

Làm cách nào tôi có thể tìm lỗi 404 trên trang web của mình?

Có một số cách tốt để giải quyết vấn đề này. Tôi thành thật khuyên bạn nên làm tất cả – vì một số công cụ có thể tìm thấy các vấn đề mà các công cụ khác không thấy.

Thu thập thông tin trang web của bạn. Có một loạt các trình thu thập thông tin thực sự tuyệt vời, tôi thích nhất là Screaming Frog cho các trang web nhỏ và DeepCrawl cho các trang web rất lớn / doanh nghiệp (cả hai thường hoạt động trong mọi tình huống, đó thường là sở thích cá nhân hoặc cân nhắc ngân sách. Sitebulb là một công cụ tuyệt vời khác). Mỗi lỗi sẽ cho bạn biết những lỗi mã trạng thái nào được liên kết trên trang web của bạn.

Kiểm tra Báo cáo phạm vi của Google Search Console (GSC – trước đây gọi là Công cụ quản trị trang web của Google), trong phần Bị loại trừ:

Lỗi 404, kiểm tra và sửa lỗi

Báo cáo Mức độ phù hợp của Google Search Console (GSC). Nhấp vào hộp “Bị loại trừ” để xem những URL nào trên trang web của bạn bị loại trừ.

Lỗi 404, kiểm tra và sửa lỗi

Phiên bản này giúp bạn xem các URL mà Google tin rằng là Soft 404.

Lỗi 404, kiểm tra và sửa lỗi

Nếu bạn có lỗi 404 mà Google đã phát hiện, bạn sẽ tìm thấy chúng bằng cách nhấp vào tiêu đề này.

Kiểm tra Google Analytics (GA) Tìm kiếm tiêu đề trang có chứa “không tìm thấy” hoặc “404” – đây là một danh sách tuyệt vời cho bạn biết số lần một trang cụ thể đã bị truy cập và do đó có thể giúp bạn ưu tiên những lỗi nào cần sửa tốt hơn Đầu tiên.

Lỗi 404, kiểm tra và sửa lỗi

Cách tìm 404 trong Google Analytics

Kiểm tra tệp nhật ký của bạn. Đây là cách yêu thích của tôi để kiểm tra lỗi 404 (và các vấn đề khác nữa!), 

Vì bạn có thể biết chính xác ai – hay còn gọi là bot nào – đang gặp lỗi nào, trên những trang cụ thể nào, tần suất xảy ra và tổng “tỷ lệ lỗi” trên trang web của bạn . Thật không may, không phải ai cũng có thể truy cập vào các tệp nhật ký, tùy thuộc vào nền tảng và máy chủ lưu trữ của bạn. 

Nói chuyện với nhóm CNTT và / hoặc nhóm phát triển của bạn để xem liệu đây có phải là một lựa chọn dành cho bạn hay không. Bạn sẽ cần một công cụ phân tích nhật ký để thực hiện việc này; yêu thích của tôi là từ Screaming Frog.

Xem thêm Kỹ thuật Audit SEO

Làm thế nào tôi có thể tìm thấy lỗi 404 trên các trang mà chúng (được cho là) ​​được liên kết từ đó?

Nếu bạn đang gặp sự cố khi tìm ra lỗi 4 {xx} trên trang mà nó được liên kết (ví dụ: từ các liên kết nội bộ), đây là một số điều bạn có thể kiểm tra. 

Nếu bạn không thể tìm thấy URL bằng bất kỳ phương pháp nào trong số này, có thể sự cố đã từng tồn tại nhưng đã được khắc phục.

1) Định kỳ chạy thu thập thông tin mới của trang web để tìm và sửa các lỗi cũ và mới.

Trước tiên, hãy kiểm tra xem liên kết đến từ một liên kết đến hay một chuyển hướng. Báo cáo liên kết 404 của Screaming Frog sẽ cho bạn biết đó là cái nào; các trình thu thập thông tin khác như DeepCrawl và Sitebulb có thể cung cấp cho bạn dữ liệu tương tự.

Nếu câu trả lời là “AHREF”, bạn có thể tìm thấy câu trả lời qua siêu liên kết trực tiếp và bạn có thể tiếp tục các bước bên dưới.

Nếu câu trả lời là “Chuyển hướng HTTP”, thì nguồn của liên kết là một URL được liên kết khác, sau đó chuyển hướng đến trang bị hỏng của bạn. Kiểm tra tệp chuyển hướng của bạn để tìm URL gốc (ví dụ: trong Apache hoặc tệp Htaccess) hoặc trung tâm quản trị / CMS của trang web của bạn (ví dụ: trong plugin chuyển hướng WordPress.) Cập nhật vị trí chuyển hướng để nó không còn trỏ đến trang bị hỏng.

Lỗi 404, kiểm tra và sửa lỗi

2) Xem Nguồn trên URL được đề cập và Control + Tìm (C + F) cho đường dẫn của URL bị hỏng.

3) View Render Source 

(plugin của trình duyệt bên thứ 3 như plugin View Render Source này dành cho Chrome) sẽ hiển thị cho bạn mã nguồn SAU KHI trình duyệt đã kết xuất nó (ví dụ: sau khi Javascript và CSS đã chạy.) Một lần nữa, C + F để tìm URL bị hỏng con đường.

4) Sử dụng Google Analytics và tìm kiếm “404” hoặc “Không tìm thấy trang” trong Tiêu đề.

 Khi bạn thu hẹp URL vi phạm, hãy nhấp vào bảng Điều hướng để tìm các trang trước trong đường dẫn đó.

Xem thêm Kiểm tra SEO kỹ thuật-Technical seo checklist

5) Chạy URL thông qua Công cụ thân thiện với thiết bị di động từ GSC. 

Sau khi chạy, hãy nhấp vào tab HTML và Sao chép + Dán nội dung của kết quả vào tài liệu Word, trình soạn thảo văn bản, v.v. Một lần nữa, nhấn C + F để tìm đường dẫn URL bị hỏng.

Làm thế nào tôi có thể tìm thấy lỗi 404 không được liên kết trên trang web của tôi?

Không có gì lạ khi lỗi 404 xảy ra trên các URL … chưa từng tồn tại trên trang web của bạn. Điều này thường là do:

Vấn đề với Googlebot thu thập dữ liệu JS, HTML hoặc CSS không chính xác. 

Tìm những lỗi này qua GSC> trong báo cáo Bị loại trừ. May mắn thay, vì Google đã cải thiện khả năng thu thập dữ liệu JS một cách hiệu quả, điều này ngày càng ít xảy ra hơn.

Các liên kết bên ngoài đến trang web của bạn có đường dẫn bị hỏng (ví dụ: một trang web khác đang tích cực liên kết đến một trang không hoạt động trên trang web của bạn.) 

Bạn có thể khám phá những liên kết này bằng các công cụ của bên thứ ba. Yêu thích của tôi là báo cáo Backlink bị hỏng trong Ahrefs (một công cụ SEO trả phí.) Bạn có thể xuất dữ liệu này trong tệp CVS, sau đó thu thập dữ liệu từng URL trong Chế độ danh sách để xem những gì đang hoạt động trong 404 ngày hôm nay.

Xem thêm Noindex và nofollow & Disallow

Mẹo chuyên nghiệp:

1) Đôi khi bạn sẽ thấy lỗi 404 trong GSC mà không có “nguồn” và bạn không thể tìm thấy bất kỳ liên kết nào – nội bộ hoặc bên ngoài. Tùy thuộc vào khối lượng, bạn có thể bỏ qua những điều này hoặc chỉ cần chuyển hướng chúng.

2) Bộ nhớ cache của web có thể là một yếu tố cản trở quá trình QA – có thể một URL cụ thể hiện không phải là 404ing, nhưng đã từng – hoặc không phải, nhưng hiện tại là như vậy. Vì vậy, hãy nhớ xóa bộ nhớ cache trang web của bạn và cả bộ nhớ cache của trình duyệt, nếu bạn gặp phải bất kỳ sự lạ nào.

3) Hãy cẩn thận khi tạo “bước chuyển hướng” (ví dụ: chuyển hướng từ trang A đến trang B và sau đó đến trang C) hoặc “vòng lặp chuyển hướng” (ví dụ: chuyển hướng từ trang D đến trang E và sau đó quay lại trang F, vì vậy khách truy cập web không thể truy cập vào bất kỳ URL chức năng nào!) Hầu hết các trình thu thập thông tin tốt có thể giúp bạn xác định những URL này trong thực tế.

4) Hãy nhớ rằng không phải mọi liên kết bên ngoài đều có giá trị chuyển hướng. Nếu liên kết bị hỏng là từ một trang web spam hoặc có giá trị thực sự thấp, tốt hơn hết bạn nên bỏ qua nó. Bạn có thể xác định câu trả lời này cho chính mình, một lần nữa thông qua các công cụ của bên thứ 3 trả phí HOẶC thông qua kiểm tra trực quan thủ công. Ví dụ về các cách để xác định chất lượng nhanh chóng bao gồm: 

Ahref’s DR (xếp hạng miền) và UR (chỉ số xếp hạng URL) hoặc Moz’s DA (Cơ quan quản lý miền) hoặc điểm Spam. Tìm hiểu thêm về các lỗi kiểm tra để xác định những gì bạn khắc phục.

Xem thêm Các công cụ kiểm tra SEO kỹ thuật miễn phí

Làm cách nào để khắc phục lỗi 404? Tôi có thể ngăn chặn lỗi 404 không?

Có nhiều cách khác nhau để sửa lỗi 404, tùy thuộc vào thiết lập / nền tảng của trang web và khả năng / ưu tiên của nhóm phát triển phần mềm của bạn. Nhưng câu trả lời đơn giản nhất là thực hiện chuyển hướng 301.

Bạn có thể triển khai điều này cho chính mình trong trung tâm quản trị trang web của bạn. Nếu vậy, đây là cách dễ nhất để làm như vậy! Chỉ cần chọn URL mới tốt nhất, trang này cũng nên được chuyển hướng (lý tưởng là một cái gì đó có liên quan cao.)

Đôi khi, bạn cần phải thông qua phần mềm hoặc nhóm CNTT của mình. Không có gì lạ nếu họ không tiếp tục thực hiện công việc này – dừng hoàn toàn hoặc do số lượng phải thực hiện (đôi khi có rất nhiều). Không phải lúc nào họ cũng nhìn thấy giá trị và họ đang tập trung vào các ưu tiên kinh doanh khác. Nói chung, đó là điều mà tôi khuyên bạn nên chiến đấu trong giới hạn. Xem thêm về điều này bên dưới.

Bạn có thể ngăn chặn chúng? Không. Chúng chỉ là một thực tế của thế giới và việc phớt lờ chúng sẽ không giúp ích được gì. Hãy xem xét “nợ kỹ thuật” 404s mà bạn cần tìm / bác sĩ thú y / giải quyết định kỳ.

Xem thêm Cách bảo trì nội dung chất lượng

Tôi không thể để các trang tiếp tục 404? Google nói là ổn!

Có họ nói điều này! Thật không may, Google đôi khi nói những điều không – nói một cách chính xác – chính xác. Xem: 

Các nhà tiếp thị nói rằng hầu hết các tuyên bố công khai của Google là sai hoặc gây hiểu lầm. Dưới đây là một số điểm làm rõ:Chủ động liên kết đến 404 chỉ là không tốt – đối với tất cả mọi người. Mất người dùng và do đó mất cơ hội doanh thu.Có quá nhiều lỗi 404 hoặc các lỗi trang web khác, có thể góp phần vào tỷ lệ lỗi tổng thể cao trên trang web của bạn, điều này có thể khiến Google không tin tưởng vào trang web của bạn. Thêm vào đó, bạn thực sự không muốn Googlebot dành thời gian thu thập dữ liệu 404 thay vì nội dung chất lượng cao, đúng chức năng của bạn – phải không?‍ URL lỗi có thể có giá trị SEO – mà bạn không thể / không nhận được nếu bạn không sửa chúng.

Khi có trường hợp kinh doanh không chuyển hướng một số URL – thay vào đó, hãy xem xét đưa ra thông báo 410 “Đã đi”. Các trường hợp sử dụng để không chuyển hướng mọi thứ: trang web của bạn bị tấn công và các URL được đề cập là vấn đề về spam / phần mềm độc hại! Hoặc là bạn đã mua miền của mình từ bên thứ ba và từng có các trang dành cho một doanh nghiệp khác – và bạn chủ động không muốn chúng liên kết với doanh nghiệp mới của mình.) Googlebot có xu hướng tôn trọng 410s nhanh hơn nhiều so với 404.

Vấn đề với 404, như chúng ta thấy – là Googlebot dường như coi chúng là “tạm thời”. Nếu có các liên kết đang hoạt động đến các trang 404 – trên trang web của bạn hoặc các trang khác trên web – thì Google có thể và sẽ tiếp tục kiểm tra chúng để xem khi nào chúng sẽ được sửa. 

Họ sẽ tiếp tục làm điều này trong nhiều tháng – và đôi khi nhiều năm – sau khi các URL ngừng hoạt động (ngay cả khi bạn sửa chúng), nếu bạn không giải quyết chúng.

Bạn có thể tự mình xác nhận điều này bằng cách xem các tệp nhật ký của mình và xem số lượng / tần suất Googlebot truy cập các trang 404ing.Nếu / khi bạn cần “kiểm tra” những gì được chuyển hướng, đây là quy trình được đề xuất của chúng tôi.

Xem thêm Các công cụ seo onpage miễn phí

404 error và liên kết bị hỏng

Một trong những điều khó chịu nhất có thể xảy ra với khách truy cập là gặp phải lỗi 404 “không tìm thấy trang” trên trang web của bạn. Công cụ tìm kiếm cũng có xu hướng không thích những lỗi như vậy. Thật khó chịu, các công cụ tìm kiếm thường gặp phải các loại 404 khác với khách truy cập của bạn, đó là lý do tại sao phần đầu tiên của bài đăng này được chia thành hai:

Đo lường các trang lỗi 404 của khách truy cập

Nếu bạn sử dụng plugin MonsterInsights Analytics, plugin này sẽ tự động gắn thẻ 404 trang của bạn cho bạn. Vì vậy, nếu bạn truy cập tài khoản Google Analytics của mình và chuyển đến Hành vi → Nội dung trang web → Chi tiết nội dung và tìm kiếm 404.html, bạn sẽ tìm thấy rất nhiều thông tin về 404 của mình (nhấp để xem phiên bản lớn hơn):

Báo cáo Google Analytics hiển thị 404 trang lỗi.

Lỗi 404, kiểm tra và sửa lỗi

Bạn sẽ thấy các URL như sau:

/404.html?page=/wordpress/plugin/local-seo/&from=https://websitehcm.com/.com/articles/wordpress-seo/

Điều này cho bạn biết hai điều:

  • URL error 404 có đường dẫn /wordpress/plugin/local-seo /
  • Nó được liên kết đến từ bài viết SEO WordPress.

Sử dụng thông tin này, bạn có thể sửa lỗi 404 và đi vào bài viết và sửa liên kết.

Như bạn có thể thấy từ ảnh chụp màn hình ở trên, chúng ta thực sự cũng nhận được lỗi 404. Chúng phá vỡ cảm xúc của người dùng vì nếu người dùng đang click vào liên kết , công việc sẽ bị gián đoạn! Tuy nhiên, phải đảm bảo rằng bạn nhận ra lỗi 404 càng sớm càng tốt, vì điều này ảnh hưởng lớn đến SEO.

Xem thêm http response

Bot cũng gặp 404 error

Bên cạnh 404s cho khách truy cập, các công cụ tìm kiếm cũng sẽ bắt gặp 404s trên trang web của bạn có thể khá khác nhau. Bạn có thể tìm thấy 404 mà nhện công cụ tìm kiếm gặp phải bằng cách đăng nhập vào các chương trình Công cụ quản trị trang web tương ứng của chúng. Có ba chương trình công cụ quản trị trang web có thể cung cấp cho bạn báo cáo lập chỉ mục, trong đó chúng cho bạn biết chúng đã gặp phải lỗi 404 nào:

Một trong những điều kỳ lạ mà bạn sẽ thấy nếu tìm hiểu các chương trình Công cụ quản trị trang web đó là trình thu thập dữ liệu công cụ tìm kiếm có thể gặp phải 404 mà người dùng bình thường sẽ không bao giờ gặp phải. Điều này là do trình thu thập thông tin tìm kiếm sẽ thu thập thông tin về bất kỳ thứ gì trên hầu hết các trang web, vì vậy ngay cả các liên kết bị ẩn cũng sẽ được theo dõi.

Nếu bạn thực sự nghiêm túc về việc bảo trì trang web, bạn có thể muốn tìm các mã 404 này trước khi các công cụ tìm kiếm gặp phải chúng. Trong trường hợp đó, việc khai thác trang web của bạn bằng một công cụ như Screaming Frog sẽ cung cấp cho bạn nhiều thông tin chi tiết. Các công cụ này được xây dựng đặc biệt để hoạt động giống như trình thu thập thông tin của công cụ tìm kiếm và do đó sẽ giúp bạn tìm ra rất nhiều vấn đề.

Cách kiểm tra & ưu tiên các lỗi 404 & các lỗi khác để sửa

Mặc dù chúng tôi thường khuyên bạn nên sửa lỗi 404 và các lỗi khác thông qua chuyển hướng 301, nhưng đôi khi việc sửa tất cả chúng là không thể thực hiện được hoặc không khả thi – do các hạn chế về kỹ thuật, ưu tiên kinh doanh cạnh tranh hoặc chính trị nội bộ. (Đôi khi nó không phải là một trận chiến đáng để chiến đấu!)

Đây là cách chúng tôi tiếp cận quy trình “kiểm tra lỗi và ưu tiên” này:Xác định các trang lỗi mà khách truy cập trang web gặp phải. Sử dụng Google Analytics và / hoặc các tệp nhật ký của bạn để xác định những điều này. Ưu tiên các trang đó theo tần suất và có khả năng là theo doanh thu theo lịch sử (ví dụ: chuyển hướng các trang đã giúp bạn kiếm được nhiều tiền trong quá khứ !.Xác định các trang lỗi mà bot công cụ tìm kiếm gặp phải. Sử dụng các tệp nhật ký của bạn để xác định những điều này. Ưu tiên chúng theo tần suất và tuổi thọ (nói cách khác – Googlebot có còn hoạt động nhiều tháng và nhiều năm sau khi nó ngừng hoạt động không? 

Nếu vậy, hãy xem xét chuyển hướng nó. Googlebot đang kiểm tra nó nhiều lần để biết lý do!)Xác định các trang lỗi có các liên kết ngược hoạt động / chức năng cho chúng. Các URL có nhiều liên kết ngược hơn / tốt hơn thì chuyển hướng quan trọng hơn, vì vậy bạn có thể hưởng lợi từ sức mạnh của các liên kết hiện có này; điều này được gọi là “xây dựng liên kết ngược bị hỏng”.Bạn cũng có thể cân nhắc sử dụng Thông tin chi tiết về mức độ ưu tiên của GSC trong báo cáo lỗi – được cho là, các thông tin này theo thứ tự ưu tiên xếp hạng.Nếu các URL bạn thấy trong GSC không đáp ứng bất kỳ tiêu chuẩn nào ở trên, bạn có thể an toàn bỏ qua chúng (và để chúng giữ nguyên trạng thái 404.) Ngoài ra, hãy xem xét sử dụng mã trạng thái 410 (Đã qua) thay vì 404. Google có xu hướng xử lý 410 lỗi nhanh hơn (ví dụ: bằng cách lập chỉ mục chúng và ngừng thu thập thông tin chúng.)

Sửa lỗi 404

Bây giờ chúng ta đã tìm thấy tất cả các lỗi 404 này, đã đến lúc khắc phục chúng. Nếu bạn biết nguyên nhân gây ra lỗi 404 và bạn có thể sửa liên kết gây ra lỗi này, thì tốt nhất là bạn nên làm điều đó. Đây sẽ là dấu hiệu tốt nhất về chất lượng trang web của bạn cho cả người dùng và công cụ tìm kiếm.

Xem thêm crawl error

Vì các công cụ tìm kiếm sẽ tiếp tục truy cập các URL đó trong một thời gian khá dài, nên việc chuyển hướng các URL bị lỗi đó đến các trang phù hợp cũng rất hợp lý. Để tạo các chuyển hướng đó, bạn có thể thực hiện một số điều sau:

Tạo chúng theo cách thủ công trong .htaccess hoặc cấu hình máy chủ NGINX của bạn

Mặc dù cách này không dành cho những người yếu về kỹ thuật, nhưng đây thường là một trong những phương pháp nhanh nhất hiện có nếu bạn có bí quyết và khả năng thực hiện.

Tạo chúng bằng một plugin chuyển hướng

Có một số plugin chuyển hướng trên thị trường, plugin được biết đến nhiều nhất là 301 redirects. Điều này dễ dàng hơn rất nhiều nhưng có nhược điểm là chậm hơn rất nhiều vì để thực hiện chuyển hướng, toàn bộ cài đặt WordPress phải tải trước. Điều này thường thêm nửa giây đến một giây vào thời gian tải cho chuyển hướng cụ thể đó.

Kiểm tra lỗi hình ảnh / nhúng

Nếu bạn xem nhật ký máy chủ của mình, bạn cũng sẽ gặp phải lỗi 404 thuộc một loại khác: lỗi 404 đối với hình ảnh bị hỏng hoặc video bị lỗi nhúng. Bạn cũng có thể gặp lỗi không hiển thị trong nhật ký của mình, chẳng hạn như lỗi nhúng video YouTube bị hỏng. Chúng không làm cho toàn bộ trang không hoạt động, nhưng chúng trông rất cẩu thả. Những loại lỗi này khó tìm hơn vì các chương trình công cụ quản trị trang web không báo cáo chúng một cách đáng tin cậy và bạn cũng không thể theo dõi chúng bằng một thứ gì đó như Google Analytics.

Phương pháp dễ nhất để tìm các hình ảnh bị hỏng và nhúng này là sử dụng một trong các trình thu thập dữ liệu nói trên. Screaming Frog, rất tốt trong việc tìm kiếm các hình ảnh bị hỏng. Một phương pháp khác là kiểm tra nhật ký máy chủ của bạn và duyệt qua chúng để tìm kiếm sự kết hợp của 404 với “.jpg” và “.png”.

Bạn nên kiểm tra lỗi 404 bao lâu một lần?

Bạn nên kiểm tra 404s của mình ít nhất một lần mỗi tháng và trên một trang web lớn hơn, hàng tuần. Nó không thực sự phụ thuộc vào lượng khách truy cập mà bạn có mà phụ thuộc nhiều hơn vào số lượng nội dung bạn có và tạo ra và bao nhiêu lỗi có thể xảy ra vì điều đó. Lần đầu tiên bạn bắt đầu xem xét và cố gắng sửa các trang lỗi 404 của mình, bạn có thể phát hiện ra rằng có rất nhiều trong số đó và có thể mất khá nhiều thời gian… Hãy cố gắng tạo thói quen để ít nhất bạn sẽ tìm thấy những cái quan trọng một cách nhanh chóng.

404 có nên được lập chỉ mục không?

Chắc chắn không phải. Đừng lập chỉ mục các trang lỗi! 

Điều đó giống như yêu cầu trải nghiệm người dùng kém lý tưởng hơn!

Leave a Reply