Website là gì

Website là gì

Trang web là một tập hợp các tài liệu HTML có thể được gọi là các trang web riêng lẻ thông qua một URL trên web với ứng dụng khách chẳng hạn như trình duyệt.

Bên cạnh nội dung cổ điển như văn bản, các trang web internet cũng có thể bao gồm các phương tiện hình ảnh như ảnh hoặc video, nhưng cũng có các tệp khác. Hơn nữa, các ứng dụng web cung cấp cơ hội cho người dùng tương tác với một trang web. Các trang con của một trang web được mô tả chính xác là các trang web. Các điều khoản thay thế bao gồm trang chủ hoặc trang web.

Các bài viết liên quan:

Tóm tắt nội dung

Việc tạo ra trang web

Năm 1990, trang web đầu tiên trên thế giới được xuất bản bởi một nhân viên của dự án nghiên cứu CERN ở Geneva. Chỉ ba năm sau, World Wide Web bắt đầu với các trang web có thể được gọi trên toàn thế giới thông qua kết nối internet.

Các trang web đầu tiên hầu như chỉ gồm văn bản và một vài hình ảnh. Trong quá trình thương mại hóa internet và mở rộng băng thông của các nhà cung cấp internet, các trang web ngày càng trở nên phức tạp hơn. Tuy nhiên, nhờ vào việc sử dụng Internet trên thiết bị di động ngày càng tăng, xu hướng đơn giản hóa trong thiết kế lại nổi lên.

Ngày nay có hơn 1,3 tỷ trang web trên toàn thế giới, từ các trang web nhỏ với một URL duy nhất, có thể được tạo bằng bộ công cụ xây dựng trang chủ, đến các cửa hàng trực tuyến phức tạp, được tạo chuyên nghiệp với hàng nghìn trang con. Điều thú vị là một phần lớn các trang web được sử dụng trên khắp thế giới không thể được truy cập thông qua các mạng công cộng. Trong một số trường hợp, đây là mạng nội bộ của công ty trong khi trong các trường hợp khác, đây là nội dung “web đen”, chỉ có thể được truy cập bằng một số trình duyệt nhất định. Do đó, số lượng thực tế các trang web có thể đã phá vỡ rào cản 1,3 tỷ nêu trên từ lâu.

Lưu lượng toàn cầu liên quan đến các trang web tạo ra một lượng dữ liệu hàng ngày hơn bốn tỷ gigabyte.

Xem thêm Hướng dẫn sử dụng WordPress cho người mới bắt đầu

Cấu trúc của một trang web

Ngày nay, một trang web chủ yếu được tạo thành từ nhiều trang web. Các trang web này là các tài liệu HTML được lưu trữ trong một thư mục trên một miền. Tên miền không được nhầm lẫn với trang web. Miền là địa chỉ internet mà qua đó nội dung của trang web có thể được gọi lên.

HITML không phải là một ngôn ngữ lập trình mà là một ngôn ngữ mô tả trang: Trong mã, nó được xác định phần tử nào sẽ được hiển thị tại thời điểm đó. Điều này có nghĩa là trong thiết kế của một trang web, không có hình ảnh được sử dụng cho toàn bộ trang web, mà nó được xác định trong mã cách phông chữ, màu sắc và tất nhiên, các hình ảnh hoặc video có thể được sắp xếp – tùy thuộc vào điều gì thiết bị đang được sử dụng (ví dụ như máy tính để bàn hoặc điện thoại thông minh) để truy cập nó. Khi một trang web được thiết kế để thích ứng với các yêu cầu trên thiết bị di động, nó được gọi là thiết kế đáp ứng.

Các trang riêng lẻ của một trang web được lưu trữ trong các thư mục, mỗi thư mục tạo thành URL riêng của chúng. Nếu người dùng nhập URL này, họ có thể gọi lên trang web mong muốn. URL cho các trang web riêng lẻ cũng được lưu trữ bởi công cụ tìm kiếm và trong cái gọi là “đoạn mã tìm kiếm” với các yếu tố như mô tả meta, tiêu đề meta hoặc đoạn mã chi tiết được hiển thị trong kết quả tìm kiếm dưới dạng liên kết có thể nhấp.

Tạo trang web

Trang chủ có thể được tạo với sự trợ giúp của một trình soạn thảo văn bản đơn giản. Điều này cho phép người dùng thêm các phần tử HTML. Sau đó, tệp HTML này được tải lên một thư mục hoặc một miền trên máy chủ. Bằng cách này, khách hàng có thể gọi trang web với nội dung của nó qua web.

Tài liệu HTML có thể bao gồm đường dẫn cho các loại tệp khác, chẳng hạn như tệp CSS hoặc tệp JavaScript. Chúng làm tăng chức năng hoặc có thể ảnh hưởng đến bố cục của một trang web.

Nhiều quản trị viên web không lập trình một trang web riêng lẻ mà sử dụng “bộ xây dựng trang chủ” hoặc cái gọi là “CMS”, tức là hệ thống quản lý nội dung. Đây là những chương trình mà các công ty sử dụng để tạo trang web một cách đơn giản và chuyên nghiệp. Các nhà cung cấp CMS phổ biến bao gồm WordPress, Joomla! và Wix.

Xem thêm Cách tạo một website

Các loại trang web

Có rất nhiều loại trang web có thể được tìm thấy trên World Wide Web.

Blog: Đây là hình thức phổ biến nhất của các trang web trên mạng. Bất cứ ai muốn tạo một trang web hiện nay hầu hết đều sử dụng hình thức blog. Một blog ở dạng ban đầu được đặc trưng bởi một người dùng riêng tư viết về các vấn đề theo quan điểm chủ quan của họ và xuất bản lên blog của họ. Ngày nay blog được sử dụng cho nhiều mục đích khác nhau. Ví dụ, các công ty thường có cái gọi là “blog công ty”, trong đó nhân viên viết về các chủ đề liên quan đến công ty.

Cửa hàng trực tuyến: webshop là một trang web được thiết kế để mua sắm trực tuyến. Trang web không chỉ cung cấp thông tin về sản phẩm hoặc dịch vụ, mà còn cung cấp cho khách hàng cơ hội mua hoặc đặt hàng trực tuyến các mặt hàng này.

Thư mục web: Trong những ngày đầu của Internet thương mại, các công cụ tìm kiếm không hiệu quả như bây giờ. Do đó, người dùng thường sử dụng cái gọi là “thư mục web” để tìm các trang web về một chủ đề nhất định. Ngày nay các thư mục web đóng một vai trò nhỏ hơn nhiều, vì chúng cũng thường được sử dụng để spam công cụ tìm kiếm.

Xem thêm google seo: 15 thủ thuật tăng thứ hạng

Cổng so sánh giá: Các trang web này cung cấp cho người mua cơ hội so sánh giá cho một sản phẩm.

Diễn đàn: Trong diễn đàn, các thành viên có thể đăng nhập và thảo luận trực tuyến các chủ đề đã chọn của họ.

Trang web tin tức: Đây thường là các dạng kỹ thuật số của các tạp chí tin tức cổ điển. Ngày nay, các phiên bản kỹ thuật số có độ phủ cao hơn đáng kể so với các phiên bản in.

Mạng xã hội: Các mạng xã hội như Facebook hay Twitter là những trang web đặc biệt tạo cơ hội cho người dùng tương tác. Bạn không cần miền của riêng mình để sử dụng các cổng này.

Ví dụ: các ứng dụng được sử dụng trên điện thoại thông minh hoặc máy tính không nằm trong số các trang web cổ điển. Chúng có thể so sánh với phần mềm được cài đặt trên máy tính. Các ứng dụng khác biệt với bản thân bởi thông thường chỉ có thể sử dụng được khi có kết nối internet. Ứng dụng dành cho thiết bị Android có thể được cung cấp URL của riêng chúng như một phần của lập chỉ mục ứng dụng và được lập chỉ mục bởi Google. Ở dạng này, các ứng dụng có thể so sánh với các trang web cổ điển. Tuy nhiên, chúng được thiết kế dành riêng cho thiết bị đầu cuối di động chứ không phải cho máy tính để bàn.

Xem thêm Dịch vụ thiết kế website

Các thành phần của một trang web

Ngày nay các trang web không quá khó để xây dựng. Với sự sẵn có của các CMS (Hệ thống quản lý nội dung) khác nhau như WordPress, bất kỳ ai cũng có thể thiết lập trang web của mình trong vòng vài phút. Cả hai chủ đề miễn phí và trả phí đều có sẵn, có thể được cài đặt và trang web sẽ trông đẹp.

Nhưng ngay cả với tất cả các công cụ này, các trang web phải có một số yếu tố cần thiết mà không có bất kỳ trang web nào sẽ trông không đầy đủ và không chuyên nghiệp. Có nhiều thành phần làm cho một trang web hoàn chỉnh và hoạt động như điều hướng, đầu trang và chân trang, v.v.

Nếu bạn mới bắt đầu và chuẩn bị thiết lập một trang web thì bạn phải ghi nhớ một số thành phần để tạo ra một trang web thành công. Ví dụ: mọi trang chủ của trang web phải có tiêu đề, tiêu đề phụ, CTA (lời kêu gọi hành động), một số hình ảnh, điều hướng phù hợp và các chỉ số thành công. Ngoài ra, bằng chứng xã hội, tính năng, lời chứng thực, cung cấp nội dung có thể được thêm vào tùy thuộc vào loại trang web.

Vì vậy, hãy hiểu chi tiết các thành phần này trong phần tiếp theo…

Các bài viết liên quan:

Các thành phần phải có của một trang web

Điều hướng:

Điều hướng là một trong những Thành phần quan trọng của trang web vì nó giúp người dùng dễ dàng điều hướng trang web hoàn chỉnh và nó cũng giúp công cụ tìm kiếm có được ý tưởng về cấu trúc của trang web.

Điều hướng phức tạp có thể dễ dàng dẫn đến lưu lượng truy cập ít hơn và tỷ lệ thoát cao hơn. Tất cả các danh mục và trang chính phải có trong điều hướng. Menu thả xuống có thể được sử dụng và các danh mục phụ phải nằm trong danh mục. Điều hướng là thứ được hiển thị trên mọi trang và bài đăng của trang web vì vậy nó phải được tạo một cách cẩn thận.

Xem thêm Navigation web(điều hướng web) là gì?

Hosting web:

Mọi trang web đều có một tập hợp các tệp và thư mục trong phần phụ trợ giúp mọi người trên thế giới có thể truy cập trang web đó… và những tệp đó phải được lưu trữ ở đâu đó, để sử dụng các máy chủ web đó. Bạn phải có một dịch vụ lưu trữ đáng tin cậy vì dịch vụ lưu trữ có thể ảnh hưởng đến hiệu suất trang web theo nhiều cách, chẳng hạn như nếu bạn đang sử dụng dịch vụ lưu trữ được chia sẻ, bạn có thể phải đối mặt với thời gian ngừng hoạt động thường xuyên dẫn đến trải nghiệm người dùng không tốt. Một máy chủ lưu trữ tốt là điều bắt buộc để mọi trang web hoạt động trơn tru. Xem thêm WordPress hosting tốt nhất

CTA:

Tất cả các trang web đều có một số mục tiêu cụ thể như chuyển đổi khách truy cập thành khách hàng tiềm năng và khiến khách truy cập nhấp vào một số thứ cụ thể có thể là một nút hoặc bất kỳ thứ gì khác. Đó là lý do tại sao CTA được sử dụng. CTA là cách làm tăng chuyển đổi. Họ hướng khách truy cập thực hiện hành động mong muốn.

Thông thường, CTA khác về mặt hình ảnh với tất cả các thành phần khác của trang và chúng có thể nhìn thấy rõ ràng. Đảm bảo rằng CTA của bạn đủ lớn trên mọi loại thiết bị và chỉ sử dụng văn bản đơn giản, đừng làm cho bản sao của CTA trở nên phức tạp. Ví dụ về CTA có thể là “Gọi cho chúng tôi ngay bây giờ”, “Đăng ký ngay”, “Dùng thử miễn phí”, v.v.

Xem thêm Thiết kế button Call to action

Headline 

Đây là khía cạnh quan trọng nhất của bất kỳ trang web nào. Tiêu đề là một phần của tiếp thị lan truyền và đóng một vai trò tâm lý quan trọng. Hầu hết những cuốn sách được xuất bản đều có bìa sách rất hấp dẫn. Bìa sách gây ấn tượng mạnh cho người đọc và người đó mua sách. Tiêu đề giống như bìa sách hấp dẫn.

Hầu hết khách truy cập dành ít hơn 3 giây trên bất kỳ trang web nào và nếu dòng tiêu đề của trang web không phù hợp và tổng thể không phù hợp với trang web thì bạn có thể mất rất nhiều khách hàng tiềm năng. Luôn giữ cho tiêu đề đơn giản và đi vào trọng tâm. Sử dụng những từ đơn giản và giữ nó càng ngắn càng tốt. Xem thêm Headlines và taglines

About us

Hầu như mọi người đều tập trung vào trang chủ và các trang liên quan khác nhưng rất ít người tập trung vào trang giới thiệu. Theo các nghiên cứu đã phát hiện ra rằng trang giới thiệu của bất kỳ trang web nào là một trong những trang được truy cập nhiều nhất, nhưng vẫn không ai dành thời gian để tạo ra một trang giới thiệu hoàn hảo. Bạn nên đưa tất cả các điểm phù hợp liên quan đến trang web hoặc doanh nghiệp của bạn trong trang giới thiệu của bạn và làm cho nó hấp dẫn đối với người dùng. Người dùng thích đọc về trang web họ đang truy cập và điều này tạo ra một liên lạc cá nhân giúp phát triển mối quan hệ với người dùng về lâu dài.

Content:

Bây giờ điều này sẽ phụ thuộc vào loại trang web bạn có. Blog sẽ yêu cầu nội dung khác với các trang web dịch vụ hoặc kinh doanh nhưng nội dung sẽ cần thiết cho mọi trang web. Xuất bản nội dung độc đáo và có liên quan và tập trung vào việc cung cấp giá trị cho người đọc của bạn. Ngày nay, tiếp thị nội dung đang ở đỉnh cao và giúp ích rất nhiều trong dài hạn. Google cũng ủng hộ các trang web có nội dung chất lượng và bạn sẽ có thứ hạng cao hơn.

Xem thêm Tại sao content quan trọng với SEO

Hình ảnh:

Một trang web có nhiều hình ảnh như logo, hình ảnh, v.v. và đồ họa đóng một vai trò rất quan trọng vì chúng giúp tạo ra một cái nhìn tổng thể tốt về trang web. Hình ảnh được con người xử lý nhanh hơn vì vậy chi tiêu cho đồ họa chất lượng sẽ đáng để nỗ lực.

Hình ảnh anh hùng lớn cũng tạo ra trải nghiệm hình ảnh rất mạnh mẽ, giúp khuyến khích người dùng cuộn xuống và hình ảnh lớn thường được sử dụng làm hình nền. Ngoài ra, hãy đảm bảo rằng đồ họa được tối ưu hóa cho cả điện thoại di động… vì hình ảnh đẹp trên máy tính để bàn có thể không đẹp trên các thiết bị nhỏ.

Xem thêm SEO image

Tính thân thiện với thiết bị di động:

Trong thời đại ngày nay, máy tính xách tay và điện thoại thông minh có sự thâm nhập ngang nhau. Tuy nhiên, điện thoại thông minh đang bán chạy hơn cả máy tính xách tay. Do đó, một trong những thành phần của trang web là khả năng đáp ứng của nó hoặc mức độ rõ ràng của nó trên màn hình di động.

Các trang web đáp ứng tự động điều chỉnh trên các kích thước màn hình khác nhau. Mọi thứ từ tiêu đề, văn bản, hình ảnh, CTA, v.v. phải được tối ưu hóa cho các thiết bị màn hình nhỏ. Google cũng đang xếp hạng các trang web dựa trên yếu tố di động của họ nên đây là điều mà bạn không thể bỏ qua.

Vì vậy, đây là một số thành phần của một trang web giúp trang web đạt được mục tiêu của nó. Nếu bạn muốn ai đó phát triển trang web của mình, hãy nhớ hỏi họ về những thành phần này và sau đó đánh giá chúng dựa trên câu trả lời của họ.

Xem thêm Cách cải thiện web thân thiện di động

6 tài nguyên SEO quan trọng hàng đầu của website

Kiến trúc trang web

Kiến trúc trang web là gì?

Kiến trúc trang web là cách các trang của trang web được cấu trúc và liên kết với nhau. Kiến trúc trang web lý tưởng giúp người dùng và trình thu thập thông tin của công cụ tìm kiếm dễ dàng tìm thấy những gì họ đang tìm kiếm trên một trang web.

Tại sao kiến ​​trúc trang web lại quan trọng đối với SEO?

Ba lý do:

Lý do số 1: Kiến trúc trang web được tối ưu hóa giúp trình thu thập thông tin công cụ tìm kiếm tìm và lập chỉ mục tất cả các trang trên trang web của bạn.

Nếu bạn có các trang trên trang web của bạn có nhiều lần nhấp từ trang chủ của bạn (hoặc hoàn toàn không được liên kết từ bất kỳ trang nào khác), Googlebot sẽ gặp khó khăn trong việc tìm kiếm và lập chỉ mục các trang đó.

Website là gì

Nhưng nếu kiến ​​trúc trang web của bạn được liên kết với nhau, các trình thu thập dữ liệu có thể theo các liên kết nội bộ của bạn đến 100% các trang trên trang web của bạn:

Website là gì

Lý do # 2: Kiến trúc trang web gửi cơ quan liên kết xung quanh trang web của bạn.

Khi bạn liên kết nội bộ đến các trang có mức độ ưu tiên cao, thì càng có nhiều quyền liên kết (Xếp hạng trang) đến các trang đó. Điều này có thể giúp cải thiện thứ hạng của họ trong Google.

Website là gì

Lý do thứ 3: Kiến trúc trang web phù hợp giúp khách truy cập dễ dàng tìm thấy những gì họ cần trên trang web của bạn.

(Điều này có thể gián tiếp giúp ích cho SEO của bạn)

Xem thêm cấu trúc website

Thực hành tốt nhất

Sử dụng kiến ​​trúc trang web “phẳng”

Nói chung, kiến ​​trúc trang web “phẳng” sẽ tốt hơn cho SEO .

Kiến trúc phẳng có nghĩa là người dùng (và trình thu thập thông tin của công cụ tìm kiếm) có thể truy cập bất kỳ trang nào trên trang web của bạn trong vòng 4 lần nhấp chuột trở xuống.

Đây là hình ảnh của một kiến ​​trúc trang web phẳng:

Website là gì

Mặt khác, kiến ​​trúc trang web “Sâu” có nghĩa là các trang nhất định có thể mất thêm 4-10 lần nhấp để tiếp cận:

Website là gì

Sao nó lại quan trọng?

Đầu tiên, kiến ​​trúc trang web nông nghĩa là quyền liên kết chảy từ các trang có xu hướng nhận được nhiều liên kết ngược (như trang chủ của bạn) đến các trang mà bạn muốn xếp hạng (như trang sản phẩm).

Website là gì

Thứ hai, kiến ​​trúc phẳng có nghĩa là các trình thu thập thông tin của Google có thể tìm thấy tất cả các trang trên trang web của bạn (điều này tối đa hóa Ngân sách Thu thập thông tin của bạn ).

Ví dụ: giả sử bạn vừa khởi chạy một blog làm bánh mới.

Lý tưởng nhất là bạn muốn kiến ​​trúc của mình trông giống như sau:

Website là gì

Như bạn có thể thấy, các danh mục chính của bạn đều được liên kết trực tiếp từ trang chủ của bạn.

Và tất cả các công thức nấu ăn riêng của bạn đều được tìm thấy theo từng danh mục.

Giữ mọi thứ đơn giản

Điều này không quá quan trọng nếu bạn chạy một blog hoặc một trang web có hàng trăm trang.

Nhưng một khi bạn bắt đầu thêm hàng nghìn (hàng chục nghìn) trang khác nhau vào trang web của mình, thì sự đơn giản là LỚN.

Tôi không thể cho bạn biết đã bao nhiêu lần tôi gặp các trang web có cấu trúc trang web siêu phức tạp như thế này:

Website là gì

Điều này không chỉ có hại cho SEO mà còn là một trải nghiệm người dùng không tốt. Hãy tưởng tượng rằng bạn vừa hạ cánh trên một trang ngẫu nhiên trên trang web đó. Khả năng bạn tìm thấy một trang mà bạn thực sự cần là bao nhiêu? Thực tế bằng không.

Nhưng khi kiến ​​trúc trang web của bạn đơn giản, thì SIÊU dễ dàng cho người dùng xung quanh trang web của bạn để tìm những gì họ cần.

Website là gì

Đó là lý do tại sao bạn muốn thiết lập một hệ thống phân cấp trang web từ ngày 1. Và gắn bó với nó khi trang web của bạn phát triển.

Dưới đây là một ví dụ về cách phân cấp trang web của bạn có thể trông như thế nào:

Website là gì

Hầu hết các trang web có kiến ​​trúc phức tạp đều không bắt đầu theo cách đó. Họ bắt đầu thêm các danh mục, tên miền phụ và các trang ngẫu nhiên… kết thúc là một mớ hỗn độn.

Xem thêm navigation web

Sử dụng các trang danh mục

Các trang danh mục giúp việc tổ chức kiến ​​trúc trang web của bạn trở nên siêu dễ dàng trong thời gian dài.

Muốn khởi chạy một trang mới? Thêm nó vào một danh mục hiện có. Và liên kết đến nó từ trang danh mục đó.

Bạn muốn thêm một loạt các trang mới? Tạo một danh mục mới. Và liên kết đến các trang mới từ trang danh mục mới đó.

Nếu không có cấu trúc danh mục, các trang sẽ được thêm vào một cách ngẫu nhiên… điều này thường dẫn đến một cấu trúc trang web phức tạp.

Lưu ý: Nếu bạn chạy một trang web tương đối nhỏ (<1.000 trang), bạn có thể không cần sắp xếp mọi thứ theo danh mục.

Ví dụ, Backlinko có khoảng 120 trang được lập chỉ mục:

Website là gì

Và bởi vì mọi bài đăng và trang blog đều được liên kết với nhau, chúng tôi không thiết lập các trang danh mục.

Nhưng nếu bạn điều hành một trang web thương mại điện tử với rất nhiều trang, danh mục là yếu tố quan trọng.

Xem thêm seo với category và tag

Cấu trúc URL

Cấu trúc URL của bạn phải tuân theo các danh mục của bạn một cách hợp lý.

Dưới đây là một ví dụ về cấu trúc URL mà rất nhiều trang web sử dụng:

https://example.com/category/subcategory/keyword-keyword

URL của bạn không cần phải giống hệt như vậy. Nhưng điều quan trọng là tất cả các URL của bạn phải theo cùng một cấu trúc.

Sử dụng liên kết nội bộ

Vào cuối ngày, kiến ​​trúc trang web của bạn được xác định bởi cách các trang của bạn được liên kết với nhau.

Đó là lý do tại sao bạn muốn liên kết đến các trang danh mục của mình từ menu điều hướng:

Website là gì

Và từ các trang danh mục đến các trang riêng lẻ trong danh mục đó:

Website là gì

Ví dụ: Best Buy liên kết đến tất cả các danh mục của họ từ trang chủ của họ:

Website là gì

Và các trang danh mục đó đều liên kết đến các danh mục phụ và trang sản phẩm thương mại điện tử.

Website là gì

Lưu ý: Sử dụng HTML để điều hướng

Bạn cũng muốn sử dụng liên kết nội bộ để liên kết nội dung trang web của bạn với các trang khác trên trang web của bạn.

Ví dụ: bạn có thể thấy rằng tôi thêm liên kết nội bộ (với anchor text giàu từ khóa) từ nội dung blog của tôi đến các trang khác trên trang web của tôi:

Website là gì

Các liên kết nội bộ này không chỉ dành cho SEO. Chúng cũng giúp người dùng tìm hiểu thêm về chủ đề mà tôi đang nói đến.

Lưu ý: Đảm bảo rằng các liên kết điều hướng của bạn là HTML… không phải JS hoặc Flash.

Mặc dù Google có thể thu thập thông tin một phần và lập chỉ mục một số JavaScript, bạn chắc chắn muốn các liên kết điều hướng của mình là HTML.

Xem thêm xây dựng liên kết

Sử dụng Sơ đồ trang web

Một sitemap là một cách tuyệt vời để tăng “crawlability” của trang web của bạn. Nó cũng giúp bạn hình dung tất cả các danh mục, danh mục phụ và các trang trên trang web của bạn.

Đây là một ví dụ:

Website là gì
Liên kết trang web

Liên kết trang web là một lợi ích bổ sung mà bạn nhận được từ một kiến ​​trúc trang web mạnh mẽ.

Không có đánh dấu dữ liệu có cấu trúc cho các liên kết trang web. Chúng tự động xảy ra khi trang web của bạn có thẩm quyền và được liên kết với nhau.

Ví dụ: nếu bạn tìm kiếm “Backlinko” trên Google, bạn sẽ thấy rằng tôi có một số liên kết trang web bên dưới kết quả của tôi trong kết quả tìm kiếm:

Website là gì

Và khi bạn tìm kiếm “Nghiên cứu từ khóa Backlinko”, Google sẽ liệt kê một loạt các trang về chủ đề đó được liên kết với nhau:

Website là gì

Sơ đồ trang web

Sơ đồ trang web là gì?

Sơ đồ trang web là bản thiết kế trang web của bạn giúp các công cụ tìm kiếm tìm, thu thập thông tin và lập chỉ mục tất cả nội dung trang web của bạn. Sơ đồ trang web giúp các công cụ tìm kiếm biết được những trang nào là quan trọng nhất trên trang web của bạn.

Có bốn loại sơ đồ trang web chính:

  • Sơ đồ trang XML thông thường: Đây là loại sơ đồ trang web phổ biến nhất. Thường ở dạng Sơ đồ trang web XML liên kết đến những trang khác trên trang web của bạn.
  • Sơ đồ trang web dành cho Video: Được sử dụng đặc biệt để giúp Google hiểu nội dung video trên trang của bạn .
  • Sơ đồ trang web Tin tức: Giúp Google tìm thấy nội dung trên các trang web được chấp thuận cho Google Tin tức.
  • Sơ đồ trang web Hình ảnh: Giúp Google tìm thấy tất cả các hình ảnh được lưu trữ trên trang web của bạn.

Tại sao Sơ đồ trang web lại quan trọng?

Các công cụ tìm kiếm như Google, Yahoo và Bing sử dụng sơ đồ trang web của bạn để tìm các trang khác nhau trên trang web của bạn.

Website là gì

Như Google đã nói :

“Nếu các trang trên trang web của bạn được liên kết đúng cách, trình thu thập thông tin web của chúng tôi có thể sẽ khám phá hầu hết trang web của bạn”.

Nói cách khác: bạn có thể KHÔNG CẦN sơ đồ trang web. Nhưng nó chắc chắn sẽ không ảnh hưởng đến việc SEO của bạn. Vì vậy, nó hợp lý để sử dụng chúng.

Cũng có một số trường hợp đặc biệt mà sơ đồ trang web thực sự có ích.

Ví dụ, Google chủ yếu tìm thấy các trang web thông qua các liên kết. Và nếu trang web của bạn là thương hiệu mới và chỉ có một số ít liên kết ngược bên ngoài, thì sơ đồ trang web rất LỚN để giúp Google tìm thấy các trang trên trang web của bạn.

Hoặc có thể bạn điều hành một trang web thương mại điện tử hơn 5 triệu trang. Trừ khi bạn có liên kết nội bộ HOÀN HẢO và có rất nhiều liên kết bên ngoài, nếu không Google sẽ gặp khó khăn trong việc tìm kiếm tất cả các trang đó. Đó là nơi các sơ đồ trang web xuất hiện.

Cách xây dựng

Tạo Sơ đồ trang web

Bước đầu tiên của bạn là tạo sơ đồ trang web.

Nếu bạn sử dụng WordPress, bạn có thể nhận được một sơ đồ trang web được tạo cho bạn bằng plugin Yoast SEO .

Website là gì

Sử dụng Yoast để tạo sơ đồ trang XML của bạn để có thể cập nhật tự động (sơ đồ trang động).

Bất cứ khi nào bạn thêm một trang mới vào trang web của mình (cho dù đó là bài đăng trên blog hay trang sản phẩm thương mại điện tử), liên kết đến trang đó sẽ tự động được thêm vào tệp sơ đồ trang web của bạn:

Website là gì

Nếu bạn không sử dụng Yoast, có rất nhiều plugin khác có sẵn cho WordPress (như Sơ đồ trang web XML của Google ) mà bạn có thể sử dụng để tạo sơ đồ trang web:

Website là gì

Nếu bạn không sử dụng WordPress thì sao?

Đừng lo lắng.  công cụ tạo sơ đồ trang web của bên thứ ba như XML-Sitemaps.com sẽ giúp bạn. Chúng sẽ tạo ra một tệp XML mà bạn có thể dùng để làm sơ đồ trang web.

Website là gì

Dù bạn tạo sơ đồ trang XML của bạn bằng cách nào, khi sơ đồ trang web của bạn được tạo, bạn nên xem xét nó theo cách thủ công.

Website là gì

(Sơ đồ trang web của bạn thường được tìm thấy tại site.com/sitemap.xml.)

Nó sẽ hiển thị tất cả các trang trên trang web của bạn:

Website là gì

Nếu mọi thứ có vẻ ổn, đã đến lúc gửi sơ đồ trang web của bạn cho Google.

Gửi Sơ đồ trang web của bạn tới Google

Để gửi thông tin đăng nhập sơ đồ trang web vào tài khoản Google Search Console của bạn .

Sau đó, chuyển đến “Chỉ mục” → “Sơ đồ trang web” trong thanh bên.

Website là gì

Xem thêm sử dụng google search console

Nếu bạn đã gửi sơ đồ trang web của mình, bạn sẽ thấy danh sách “Sơ đồ trang web đã gửi” trên trang này:

Website là gì

Để gửi sơ đồ trang web của bạn, hãy nhập URL của sơ đồ trang web của bạn vào trường này:

Website là gì

Và nhấn “Gửi”.

Website là gì

Và nếu mọi thứ đã được thiết lập xong, bạn sẽ bắt đầu thấy thông tin về sơ đồ trang web của mình trên trang này trong phần “Sơ đồ trang web đã gửi”:

Website là gì
Sử dụng Báo cáo Sơ đồ trang web để phát hiện các lỗi

Khi Google đã thu thập thông tin sơ đồ trang web của bạn, hãy nhấp vào sơ đồ đó trong “Sơ đồ trang web đã gửi”:

Website là gì

Nếu bạn thấy “Chỉ mục sơ đồ trang web được xử lý thành công” thì Google đã thu thập thông tin thành công sơ đồ trang web của bạn.

Website là gì

Bạn cũng có thể nhấp vào biểu tượng biểu đồ thanh nhỏ để chuyển đến Báo cáo mức độ phù hợp cho sơ đồ trang web của mình:

Website là gì

Báo cáo này cho bạn biết có bao nhiêu URL mà Google đã tìm thấy trong sơ đồ trang web của bạn… và có bao nhiêu trang trong số đó được đưa vào chỉ mục của Google:

Website là gì

Ví dụ: bạn có thể thấy, sơ đồ trang web của tôi chứa các liên kết đến 116 trang web. Trong đó 109 là “hợp lệ” và 6 là “Bị loại trừ”.

Website là gì

Tôi rõ ràng có thể bỏ qua các trang hợp lệ.

Nhưng tôi muốn kiểm tra bất kỳ trang “Bị loại trừ” nào để xem có gì.

Hóa ra 6 URL đó trong sơ đồ trang web của tôi đang nhận được thông báo “URL trùng lặp, đã gửi không được chọn làm chuẩn”.

Website là gì

Và khi tôi nhìn vào các URL, tôi thấy rằng đây là những trang mà tôi thậm chí không muốn lập chỉ mục ngay từ đầu.

Website là gì

Vì vậy, tôi nên xóa chúng khỏi sơ đồ trang web của mình.

Sử dụng Sơ đồ trang web của bạn để tìm sự cố với lập chỉ mục

Một trong những điều thú vị về việc sử dụng sơ đồ trang web là nó có thể cung cấp cho bạn một ước tính về điểm bóng về:

  • Bạn MUỐN lập chỉ mục bao nhiêu trang
  • Có bao nhiêu trang ĐƯỢC lập chỉ mục

Ví dụ: giả sử rằng sơ đồ trang web của bạn liên kết đến 5.000 trang.

Nhưng khi bạn nhìn vào Google Search Console, trang web của bạn chỉ có 2.000 trang được lập chỉ mục.

Đó là một dấu hiệu cho thấy điều gì đó đang xảy ra. Có thể là có rất nhiều nội dung trùng lặp trong 5.000 trang đó. Vì vậy, Google không lập chỉ mục tất cả chúng.

Hoặc có thể số lượng trang trên trang web của bạn vượt quá ngân sách thu thập thông tin của bạn .

Xem thêm index là gì

So khớp Sơ đồ trang web của bạn và Robots.txt

Điều quan trọng là sơ đồ trang web và Robots.txt của bạn phải hoạt động cùng nhau.

Nói cách khác:

Nếu bạn xem một trang trong Robots.txt hoặc sử dụng thẻ “noindex” trên một trang, bạn KHÔNG muốn nó xuất hiện trong sơ đồ trang web của mình.

Nếu không, bạn đang gửi các tin nhắn hỗn hợp tới Google.

Sơ đồ trang web của bạn cho biết: “Trang này đủ quan trọng để đưa nó vào sơ đồ trang web của chúng tôi”. Nhưng khi Googlebot truy cập vào trang, chúng sẽ bị chặn.

Xem thêm hướng dẫn sử dụng robots.txt

Mẹo dành cho Sơ đồ trang web

Trang web lớn? Chia nhỏ mọi thứ thành các sơ đồ trang web nhỏ hơn: Sơ đồ trang web có giới hạn 50k URL . Vì vậy, nếu bạn chạy một trang web với nhiều trang, Google khuyên bạn nên chia sơ đồ trang web của mình thành nhiều sơ đồ trang web nhỏ hơn.

Hãy cẩn thận với ngày tháng: URL trong sơ đồ trang web của bạn có ngày “sửa đổi lần cuối” được liên kết với chúng.

Website là gì

Tôi khuyên bạn CHỈ nên thay đổi những ngày này khi bạn thực hiện những thay đổi quan trọng đối với trang web của mình (hoặc thêm nội dung mới vào trang web của bạn). Nếu không, Google cảnh báo rằng việc cập nhật ngày tháng trên các trang không thay đổi có thể được coi là một chiến thuật spam.

Đừng đổ mồ hôi cho Sơ đồ trang web dành cho Video: Sơ đồ video đã thay thế phần lớn nhu cầu về sơ đồ trang web dành cho video. Sơ đồ trang web dành cho video chắc chắn sẽ không ảnh hưởng đến khả năng trang của bạn có được đoạn mã chi tiết về video . Nhưng nó thường không đáng để gặp rắc rối.

Duy trì Dưới 50MB: Cả Google và Bing đều cho phép các sơ đồ trang web có dung lượng lên đến 50MB . Vì vậy, miễn là bạn dưới 50MB là tốt.

Sơ đồ trang web HTML: Về cơ bản, đây tương đương với một sơ đồ trang XML… nhưng dành cho người dùng.

Website là gì

Bạn không nhất thiết phải cần những thứ này vì Google và các công cụ tìm kiếm khác hiện dựa vào sơ đồ trang XML của bạn. Nhưng nếu bạn nghĩ rằng chúng hữu ích cho khách truy cập, một sơ đồ trang web HTML có thể sẽ không ảnh hưởng đến nỗ lực SEO của bạn.

Số lượng(ngân sách) Thu thập thông tin

Số lượng Thu thập thông tin là gì?

Ngân sách thu thập thông tin là số lượng trang mà Googlebot thu thập dữ liệu và lập chỉ mục trên một trang web trong một khung thời gian nhất định.

Tại sao Ngân sách thu thập thông tin lại quan trọng đối với SEO?

Tóm lại: nếu Google không lập chỉ mục một trang, nó sẽ không xếp hạng cho bất kỳ thứ gì.

Vì vậy, nếu số lượng trang của bạn vượt quá ngân sách thu thập thông tin của trang web, các trang trên trang web của bạn không được lập chỉ mục.

Website là gì

Điều đó nói rằng, phần lớn các trang web ngoài kia không cần phải lo lắng về ngân sách thu thập thông tin. Google THỰC SỰ giỏi trong việc tìm kiếm và lập chỉ mục các trang.

Điều đó nói rằng, có một số trường hợp mà bạn muốn chú ý đến việc thu thập thông tin ngân sách:

  • Bạn điều hành một trang web lớn: Nếu bạn có một trang web (như trang thương mại điện tử) với hơn 10k trang, Google có thể gặp khó khăn khi tìm tất cả chúng.
  • Bạn vừa thêm một loạt trang: Nếu gần đây bạn đã thêm một phần mới vào trang web của mình với hàng trăm trang, bạn muốn đảm bảo rằng mình có ngân sách thu thập thông tin để tất cả chúng được lập chỉ mục nhanh chóng.
  • Nhiều chuyển hướng: Rất nhiều chuyển hướng và chuỗi chuyển hướng tiêu tốn ngân sách thu thập thông tin của bạn.

Cùng với đó, đây là một số cách đơn giản để tối đa hóa ngân sách thu thập dữ liệu trang web của bạn.

Thực hành tốt nhất

Cải thiện tốc độ trang web

Cải thiện tốc độ trang của trang web của bạn có thể dẫn đến việc Googlebot thu thập dữ liệu nhiều hơn các URL trên trang web của bạn.

Xem thêm tốc độ là yếu tố xếp hạng

Trên thực tế, Google tuyên bố rằng :

“Tạo trang web nhanh hơn sẽ cải thiện trải nghiệm của người dùng đồng thời tăng tốc độ thu thập dữ liệu.”

Nói cách khác:

Các trang tải chậm tiêu tốn thời gian quý báu của Googlebot.

Website là gì

Nhưng nếu các trang của bạn tải nhanh chóng, Googlebot có thời gian để truy cập và lập chỉ mục nhiều trang của bạn hơn.

Website là gì
Sử dụng liên kết nội bộ

Googlebot ưu tiên các trang có nhiều liên kết bên ngoài và bên trong trỏ đến chúng.

Có, lý tưởng là bạn sẽ nhận được các liên kết ngược trỏ đến mọi trang trên trang web của bạn. Nhưng điều đó không thực tế trong hầu hết các trường hợp.

Đó là lý do tại sao liên kết nội bộ rất quan trọng.

Các liên kết nội bộ của bạn gửi Googlebot đến tất cả các trang khác nhau trên trang web mà bạn muốn lập chỉ mục.

Website là gì
Kiến trúc trang web phẳng

Theo Google :

“Các URL phổ biến hơn trên Internet có xu hướng được thu thập thông tin thường xuyên hơn để giữ cho chúng mới hơn trong chỉ mục của chúng tôi.”

Và trong thế giới của Google, phổ biến = cơ quan liên kết.

Đó là lý do tại sao bạn muốn sử dụng kiến trúc trang web phẳng trên trang web của mình.

Xem thêm cấu trúc trang web

Kiến trúc phẳng thiết lập mọi thứ để tất cả các trang trên trang web của bạn có một số thẩm quyền liên kết chuyển đến chúng.

Website là gì
Tránh “Trang mồ côi”

Các trang mồ côi là các trang không có liên kết bên trong hoặc bên ngoài trỏ đến chúng.

Website là gì

Google thực sự gặp khó khăn khi tìm các trang mồ côi. Vì vậy, nếu bạn muốn tận dụng tối đa ngân sách thu thập thông tin của mình, hãy đảm bảo rằng có ít nhất một liên kết nội bộ hoặc liên kết bên ngoài trỏ đến mọi trang trên trang web của bạn.

Xem thêm orphaned content

Hạn chế nội dung trùng lặp

Hạn chế nội dung trùng lặp là thông minh vì nhiều lý do.

Hóa ra, nội dung trùng lặp có thể ảnh hưởng đến ngân sách thu thập thông tin của bạn.

Website là gì

Đó là bởi vì Google không muốn lãng phí tài nguyên bằng cách lập chỉ mục nhiều trang có cùng nội dung.

Vì vậy, hãy đảm bảo rằng 100% các trang trên trang web của bạn được tạo từ nội dung chất lượng và độc đáo.

Điều này không dễ dàng đối với một trang có hơn 10k trang. Nhưng đó là điều bắt buộc nếu bạn muốn tận dụng tối đa ngân sách thu thập thông tin của mình.

Xem thêm duplicated content

Tốc độ trang và SEO

Tốc độ trang là gì?

Tốc độ trang là lượng thời gian cần thiết để tải một trang web. Tốc độ tải của trang được xác định bởi một số yếu tố khác nhau, bao gồm máy chủ của trang web, kích thước tệp trang và nén hình ảnh.

Mà nói:

“Tốc độ trang” không đơn giản như nó có âm thanh.

Đó là bởi vì có rất nhiều cách khác nhau để đo tốc độ trang. Dưới đây là ba trong số những điều phổ biến nhất:

Trang được tải đầy đủ: Đây là khoảng thời gian cần để tải 100% tài nguyên trên một trang. Đây là cách đơn giản nhất để xác định tốc độ tải trang.

Time to First Byte: Tính năng này đo lường thời gian một trang bắt đầu quá trình tải.

Website là gì

Nếu bạn đã từng truy cập vào một trang và nhìn chằm chằm vào màn hình trắng trong vài giây, đó là TTFB đang làm việc.

Bức tranh có ý nghĩa đầu tiên / Bức tranh theo ngữ cảnh đầu tiên: Thời gian một trang tải đủ tài nguyên của nó để người dùng có thể đọc nội dung trên trang đó.

Ví dụ: giả sử bạn có một bài đăng trên blog mất 10 giây để tải đầy đủ.

Website là gì

Đó là một thời gian dài… nếu bạn CHỈ nhìn vào thời gian tải toàn bộ trang.

Mặt khác, việc chú ý đến Bức tranh có ý nghĩa đầu tiên đôi khi thể hiện tốt hơn cách người dùng thực sự tương tác với trang của bạn khi nó tải.

Xem thêm Cách tạo nội dung từ kết quả tìm kiếm

Ví dụ: hãy xem lại trang mất 10 giây để tải tất cả các tài nguyên của trang.

Mặc dù phải mất một lúc để toàn bộ trang tải, khi người dùng truy cập trang lần đầu tiên, họ sẽ nhận được “Bức tranh có ý nghĩa đầu tiên” sau 1,5 giây.

Website là gì

Có nghĩa là họ có thể bắt đầu tương tác với trang của bạn ngay lập tức. Vì vậy, đối với người dùng, trang của bạn rất nhanh.

Xem thêm tốc độ và seo

Kết luận?

Có rất nhiều cách khác nhau để đo tốc độ trang. Và không có chỉ số “đúng” nào đánh bại tất cả các chỉ số khác. Tất cả chúng đều có ưu và khuyết điểm.

Thay vào đó, hãy tập trung vào việc cải thiện tốc độ tải trang của bạn cho TẤT CẢ các chỉ số mà bạn tìm thấy.

Tại sao tốc độ trang lại quan trọng đối với SEO?

Google đã sử dụng tốc độ trang làm yếu tố xếp hạng kể từ năm 2010 .

Website là gì

Và vào năm 2018, Google đã nâng cao tầm quan trọng của tốc độ trang với bản cập nhật “Tốc độ” .

Website là gì

Nói ngắn gọn:

Trang web tải chậm có thể ảnh hưởng đến thứ hạng Google của bạn.

Câu hỏi đặt ra là: làm cách nào để Google xác định tốc độ tải trang web của bạn? Họ có xem mất bao lâu để tải 100% trang không? Hoặc TTFB?

Họ chưa đưa ra bất kỳ tuyên bố chính thức nào về nó. Nhưng việc họ báo cáo về tất cả các chỉ số này trong công cụ PageSpeed ​​Insights cho tôi biết rằng họ có thể sử dụng kết hợp các phép đo tốc độ trang khác nhau:

Website là gì

Cùng với đó, đây là cách cải thiện tốc độ tải trang web của bạn.

Thực hành tốt nhất

Nén hình ảnh

Tôi đặt điều này lên hàng đầu vì nó thường là chiến thắng lớn nhất.

Rốt cuộc, hình ảnh thường chiếm 50-90% kích thước của một trang.

Website là gì

(Và tốc độ tải)

Ví dụ: xem báo cáo tốc độ trang này từ một trang trên trang web của tôi:

Website là gì

Như bạn có thể thấy 86,2% kích thước trang là do hình ảnh:

Website là gì

Vì vậy, bạn càng có thể nén hình ảnh của mình, trang của bạn sẽ tải càng nhanh.

Làm sao?

Nếu trang web của bạn chạy trên WordPress, thì tôi thực sự khuyên bạn nên sử dụng một plugin có tên là WP Smush :

Website là gì

Nó tự động nén bất kỳ hình ảnh nào bạn tải lên thư viện phương tiện WordPress. Và ít nhất theo những người tạo ra plugin, điều này có thể giảm kích thước tệp hình ảnh của bạn xuống 14,2%.

Xem thêm Cách thực hiện kiểm tra nội dung SEO

Không sử dụng WordPress? Vẫn còn rất nhiều tùy chọn nén hình ảnh trên mạng, như Cesium và Mass Image Compressor .

Không giống như trước đây, hầu hết các công cụ nén hiện nay đều sử dụng tính năng nén không mất dữ liệu hoặc chỉ làm giảm chất lượng hình ảnh đến mức khó nhận thấy.

Ví dụ, chúng tôi nén 100% hình ảnh ở đây tại Backlinko. Và chúng trông vẫn đẹp và sắc nét:

Website là gì
Làm sạch và nén mã của bạn

Nói cách khác: giảm thiểu các tài nguyên được tìm thấy trên trang của bạn .

Điêu nay bao gôm:

  • HTML
  • CSS
  • JavaScript
  • Và bất kỳ mã nào khác được tìm thấy trên trang của bạn

Bước đầu tiên của bạn phải là làm sạch mọi mã thừa mà bạn có trên trang của mình. Mã bổ sung này có thể là từ các tính năng mà bạn không có trên trang web của mình nữa. Hoặc từ công việc của nhà phát triển kém chất lượng.

Dù bằng cách nào: mã của bạn càng sạch thì mọi thứ sẽ tải càng nhanh.

Sau đó, nén mã của bạn bằng một chương trình như GZip .

Nâng cấp dịch vụ lưu trữ

Đây là một mẹo mà tôi không thấy nhiều người nói đến.

Bạn có thể dọn dẹp mã của mình và nén hình ảnh suốt cả ngày. Nhưng nếu bạn chi 4,99 đô la / tháng cho việc lưu trữ, trang web của bạn sẽ không tải nhanh.

Đó là bởi vì bạn đang chia sẻ một máy chủ với hàng triệu trang web khác.

Có một triệu máy chủ web ngoài đó. Vì vậy, tôi không thể giới thiệu một cái cụ thể.

Nhưng tôi có thể nói rằng như một nguyên tắc chung: khi nói đến lưu trữ, bạn sẽ nhận được những gì bạn phải trả.

Vì vậy, nếu bạn nghiêm túc về việc cải thiện tốc độ tải trang web của mình, có thể đã đến lúc nâng cấp lên máy chủ lưu trữ cao cấp hoặc máy chủ chuyên dụng.

Kích hoạt bộ đệm trình duyệt

Điều này cho phép người dùng lưu trữ các phần của trang của bạn trong bộ nhớ cache của trình duyệt của họ.

Website là gì

Vì vậy, lần sau khi họ truy cập trang web của bạn, nó sẽ tải nhanh hơn NHIỀU.

Website là gì

Thật không may, điều này sẽ không giúp trang của bạn tải nhanh hơn đối với những khách truy cập lần đầu tiên. Nhưng nó rất tốt để cải thiện tốc độ tải của bạn cho những người đã truy cập trang web của bạn trước đây.

Bạn có thể thiết lập bộ nhớ đệm của trình duyệt trong tệp .htaccess của mình . Hoặc với một plugin WordPress.

Triển khai CDN

Mạng phân phối nội dung ( CDN ) là một trong những cách dễ nhất để tăng tốc độ tải trang web của bạn.

CDN hoạt động bằng cách tìm ra vị trí thực tế của khách truy cập… và sau đó cung cấp tài nguyên của trang web của bạn từ một máy chủ gần họ.

Website là gì
Kiểm tra với nhiều công cụ kiểm tra tốc độ trang

Bây giờ bạn đã thực hiện các bước này, đã đến lúc xem bạn đang làm như thế nào.

Và tôi khuyên bạn nên kiểm tra tốc độ trang của mình bằng hai công cụ khác nhau.

Đầu tiên là Google PageSpeed ​​Insights .

Website là gì

Công cụ của Google quét mã trang của bạn để tìm các sự cố…

Website là gì

… Và cơ hội.

Website là gì

Và gần đây họ đã thêm một tính năng báo cáo về thời gian để trang web của bạn tải cho người dùng thực tế (sử dụng dữ liệu Trình duyệt Google Chrome).

Website là gì

Cái nào là SIÊU hữu ích.

Một lời cảnh báo: đôi khi bạn sẽ thấy rằng các đề xuất của công cụ không có ý nghĩa đối với trang web của bạn.

Ví dụ: công cụ của Google đã khuyến nghị tôi “Cung cấp hình ảnh ở định dạng thế hệ tiếp theo”.

Website là gì

Tuy nhiên, các định dạng “thế hệ tiếp theo” này không được hầu hết các trình duyệt (bao gồm cả Safari và Firefox) hỗ trợ. Vì vậy, nếu bạn chuyển sang các định dạng thế hệ tiếp theo này, trải nghiệm người dùng trên trang web của bạn sẽ đi xuống.

Điều đó nói rằng: có rất nhiều thông tin chi tiết hữu ích trong công cụ này. Và tôi khuyên bạn nên triển khai càng nhiều càng tốt.

Tiếp theo, chúng tôi có WebPageTest.org .

Website là gì

Điều thú vị về WebPageTest là nó tải trang của bạn trong một trình duyệt thực tế. Và nó cho bạn biết về các phần cụ thể của trang cần nhiều thời gian để tải.

Xem thêm các công cụ tăng tốc độ website

Website là gì

Robots.txt

Robots.txt là gì?

Robots.txt là một tệp thông báo cho trình thu thập thông tin của công cụ tìm kiếm không thu thập dữ liệu các trang hoặc phần nhất định của trang web. Hầu hết các công cụ tìm kiếm lớn (bao gồm Google, Bing và Yahoo) đều nhận ra và tôn trọng các yêu cầu Robots.txt.

Tại sao Robots.txt lại quan trọng?

Hầu hết các trang web không cần tệp robots.txt.

Đó là bởi vì Google thường có thể tìm và lập chỉ mục tất cả các trang quan trọng trên trang web của bạn.

Và họ sẽ tự động KHÔNG lập chỉ mục các trang không quan trọng hoặc các phiên bản trùng lặp của các trang khác.

Điều đó nói rằng, có 3 lý do chính mà bạn muốn sử dụng tệp robots.txt.

Chặn các trang không công khai: Đôi khi bạn có các trang trên trang web của mình mà bạn không muốn được lập chỉ mục. Ví dụ: bạn có thể có phiên bản theo giai đoạn của một trang. Hoặc một trang đăng nhập. Các trang này cần phải tồn tại. Nhưng bạn không muốn những người ngẫu nhiên đổ bộ vào chúng. Đây là trường hợp bạn sử dụng robots.txt để chặn các trang này khỏi trình thu thập thông tin và bot của công cụ tìm kiếm.

Tối đa hóa ngân sách thu thập thông tin: Nếu bạn gặp khó khăn trong việc lập chỉ mục tất cả các trang của mình, bạn có thể gặp vấn đề về ngân sách thu thập thông tin . Bằng cách chặn các trang không quan trọng bằng robots.txt, Googlebot có thể chi tiêu nhiều hơn ngân sách thu thập thông tin của bạn trên các trang thực sự quan trọng.

Xem thêm sử dụng meta robots tag

Ngăn lập chỉ mục tài nguyên: Sử dụng chỉ thị meta có thể hoạt động giống như Robots.txt để ngăn các trang được lập chỉ mục. Tuy nhiên, chỉ thị meta không hoạt động tốt đối với các tài nguyên đa phương tiện, như PDF và hình ảnh. Đó là lúc robots.txt phát huy tác dụng.

Điểm mấu chốt? Robots.txt yêu cầu trình thu thập thông tin của công cụ tìm kiếm không thu thập dữ liệu các trang cụ thể trên trang web của bạn.

Bạn có thể kiểm tra xem bạn đã lập chỉ mục bao nhiêu trang trong Google Search Console .

Website là gì

Nếu số đó khớp với số trang bạn muốn lập chỉ mục, bạn không cần phải bận tâm đến tệp Robots.txt.

Nhưng nếu con số đó cao hơn bạn mong đợi (và bạn nhận thấy các URL được lập chỉ mục không nên được lập chỉ mục), thì đã đến lúc tạo tệp robots.txt cho trang web của bạn.

Thực hành tốt nhất

Tạo tệp Robots.txt

Bước đầu tiên của bạn là thực sự tạo tệp robots.txt của bạn.

Là một tệp văn bản, bạn thực sự có thể tạo một tệp bằng Windows notepad.

Và cho dù cuối cùng bạn tạo tệp robots.txt của mình theo cách nào, thì định dạng vẫn hoàn toàn giống nhau:

  • Tác nhân người dùng: X
  • Không cho phép: Y

Tác nhân người dùng là bot cụ thể mà bạn đang nói chuyện.

Và mọi thứ xuất hiện sau “disallow” là các trang hoặc phần mà bạn muốn chặn.

Đây là một ví dụ:

  • Tác nhân người dùng: googlebot
  • Disallow: / images

Quy tắc này sẽ yêu cầu Googlebot không lập chỉ mục thư mục hình ảnh trên trang web của bạn.

Bạn cũng có thể sử dụng dấu hoa thị (*) để nói chuyện với bất kỳ và tất cả các bot ghé thăm trang web của bạn.

Đây là một ví dụ:

  • Tác nhân người dùng: *
  • Disallow: / images

Dấu “*” cho bất kỳ và tất cả các trình thu thập thông tin KHÔNG thu thập thông tin thư mục hình ảnh của bạn.

Đây chỉ là một trong nhiều cách để sử dụng tệp robots.txt. Hướng dẫn hữu ích này của Google cung cấp thêm thông tin về các quy tắc khác nhau mà bạn có thể sử dụng để chặn hoặc cho phép bot thu thập dữ liệu các trang khác nhau trên trang web của bạn.

Website là gì
Làm cho tệp Robots.txt của bạn dễ tìm

Sau khi bạn có tệp robots.txt của mình, đã đến lúc làm cho tệp này hoạt động.

Về mặt kỹ thuật, bạn có thể đặt tệp robots.txt của mình vào bất kỳ thư mục chính nào trên trang web của bạn.

Nhưng để tăng khả năng tìm thấy tệp robots.txt của bạn, tôi khuyên bạn nên đặt nó tại:

https://example.com/robots.txt

(Lưu ý rằng tệp robots.txt của bạn phân biệt chữ hoa chữ thường. Vì vậy, hãy đảm bảo sử dụng chữ thường “r” trong tên tệp)

Kiểm tra lỗi và sai lầm

Thực sự điều quan trọng là tệp robots.txt của bạn được thiết lập chính xác. Một sai lầm và toàn bộ trang web của bạn có thể bị lập chỉ mục.

May mắn thay, bạn không cần phải hy vọng rằng mã của bạn được thiết lập đúng. Google có một Công cụ kiểm tra rô bốt tiện lợi mà bạn có thể sử dụng:

Website là gì

Nó hiển thị cho bạn tệp robots.txt của bạn… và bất kỳ lỗi và cảnh báo nào mà nó tìm thấy:

Website là gì

Như bạn có thể thấy, chúng tôi chặn nhện thu thập dữ liệu trang quản trị WP của chúng tôi.

Chúng tôi cũng sử dụng robots.txt để chặn thu thập dữ liệu các trang thẻ được tạo tự động của WordPress (để hạn chế nội dung trùng lặp ).

Robots.txt so với Meta Directives

Tại sao bạn lại sử dụng robots.txt khi bạn có thể chặn các trang ở cấp độ trang bằng thẻ meta “ noindex ”?

Giống như tôi đã đề cập trước đó, thẻ noindex rất khó triển khai trên các tài nguyên đa phương tiện, như video và PDF.

Ngoài ra, nếu bạn có hàng nghìn trang mà bạn muốn chặn, đôi khi sẽ dễ dàng hơn để chặn toàn bộ phần của trang web đó bằng robots.txt thay vì thêm thẻ noindex vào từng trang theo cách thủ công.

Cũng có những trường hợp khó mà bạn không muốn lãng phí bất kỳ ngân sách thu thập thông tin nào trên Google khi đến các trang có thẻ noindex.

Mà nói:

Ngoài ba trường hợp cạnh đó, tôi khuyên bạn nên sử dụng chỉ thị meta thay vì robots.txt. Chúng dễ thực hiện hơn. Và có ít khả năng xảy ra thảm họa hơn (như chặn toàn bộ trang web của bạn).

Xem thêm hướng dẫn robots.txt

Nội dung trùng lặp

Nội dung trùng lặp là gì?

Nội dung trùng lặp là nội dung là bản sao tương tự hoặc chính xác của nội dung trên các trang web khác hoặc trên các trang khác nhau trên cùng một trang web. Có một lượng lớn nội dung trùng lặp trên một trang web có thể tác động tiêu cực đến thứ hạng của Google.

Xem thêm duplicated content

Nói cách khác:

Nội dung trùng lặp là nội dung từng chữ giống như nội dung xuất hiện trên một trang khác.

Website là gì

Nhưng “Nội dung trùng lặp” cũng áp dụng cho nội dung tương tự với nội dung khác… ngay cả khi nó được viết lại một chút.

Website là gì

Nội dung trùng lặp ảnh hưởng đến SEO như thế nào?

Nói chung, Google không thích và không muốn xếp hạng các trang có nội dung trùng lặp.

Trên thực tế, Google tuyên bố rằng :

“Google cố gắng lập chỉ mục và hiển thị các trang có thông tin riêng biệt”.

Vì vậy, nếu bạn có các trang trên trang web của mình KHÔNG có thông tin riêng biệt, nó có thể làm ảnh hưởng đến thứ hạng công cụ tìm kiếm của bạn.

Cụ thể, đây là ba vấn đề chính mà các trang web có nhiều nội dung trùng lặp gặp phải.

Ít lưu lượng truy cập không phải trả tiền: Điều này khá đơn giản. Google không muốn xếp hạng các trang sử dụng nội dung được sao chép từ các trang khác trong chỉ mục của Google.

(Bao gồm các trang trên trang web của riêng bạn)

Ví dụ: giả sử bạn có ba trang trên trang web của mình với nội dung tương tự.

Website là gì

Google không chắc trang nào là “trang gốc”. Vì vậy, cả ba trang sẽ đấu tranh để xếp hạng.

Website là gì

Hình phạt (Cực kỳ hiếm): Google đã nói rằng nội dung trùng lặp có thể dẫn đến hình phạt hoặc hủy lập chỉ mục hoàn toàn của một trang web.

Website là gì

Tuy nhiên, điều này là siêu hiếm. Và nó chỉ được thực hiện trong trường hợp một trang web đang cố tình lấy hoặc sao chép nội dung từ các trang khác.

Website là gì

Vì vậy, nếu bạn có một loạt các trang trùng lặp trên trang web của mình, bạn có thể không cần phải lo lắng về “hình phạt nội dung trùng lặp”.

Ít trang được lập chỉ mục hơn: Điều này đặc biệt quan trọng đối với các trang web có nhiều trang (như các trang thương mại điện tử).

Đôi khi Google không chỉ hạ thứ hạng nội dung trùng lặp. Nó thực sự từ chối lập chỉ mục nó.

Website là gì

Vì vậy, nếu bạn có các trang trên trang web của mình không được lập chỉ mục, thì có thể là do ngân sách thu thập thông tin của bạn bị lãng phí cho nội dung trùng lặp.

Xem thêm tìm trung lặp nội dung

Thực hành tốt nhất

Xem các nội dung giống nhau trên các URL khác nhau

Đây là lý do phổ biến nhất khiến vấn đề nội dung trùng lặp xuất hiện.

Ví dụ: giả sử bạn điều hành một trang web thương mại điện tử.

Và bạn có một trang sản phẩm bán áo thun.

Website là gì

Nếu mọi thứ được thiết lập đúng, mọi kích thước và màu sắc của áo thun đó sẽ vẫn ở trên cùng một URL.

Website là gì

Nhưng đôi khi bạn sẽ thấy rằng trang web của mình tạo ra một URL mới cho mọi phiên bản khác nhau của sản phẩm… điều này dẫn đến hàng nghìn trang nội dung trùng lặp.

Website là gì

Một ví dụ khác:

Nếu trang web của bạn có chức năng tìm kiếm, các trang kết quả tìm kiếm đó cũng có thể được lập chỉ mục. Điều này có thể dễ dàng thêm hơn 1.000 trang vào trang web của bạn. Tất cả đều chứa nội dung trùng lặp.

Kiểm tra các trang được lập chỉ mục

Một trong những cách dễ nhất để tìm nội dung trùng lặp là xem số lượng trang từ trang web của bạn đã được lập chỉ mục trong Google.

Bạn có thể làm điều này bằng cách tìm kiếm site: example.com trong Google.

Website là gì

Hoặc kiểm tra các trang được lập chỉ mục của bạn trong Google Search Console .

Website là gì

Dù bằng cách nào, con số này phải phù hợp với số lượng trang mà bạn đã tạo theo cách thủ công.

Ví dụ, Backlinko có 112 trang được lập chỉ mục:

Website là gì

Đó là số lượng trang mà chúng tôi đã thực hiện.

Nếu con số đó là 16.000 hoặc 160.000, chúng tôi sẽ biết rằng rất nhiều trang được thêm tự động. Và những trang đó có thể sẽ chứa một lượng lớn nội dung trùng lặp.

Đảm bảo trang web của bạn chuyển hướng chính xác

Đôi khi bạn không chỉ có nhiều phiên bản của cùng một trang… mà còn của cùng một SITE.

Mặc dù hiếm, nhưng tôi đã thấy nó xảy ra trong tự nhiên nhiều lần.

Vấn đề này xảy ra khi phiên bản “WWW” của trang web của bạn không chuyển hướng sang phiên bản “không phải WWW”.

(Hoặc ngược lại)

Điều này cũng có thể xảy ra nếu bạn chuyển trang web của mình sang HTTPS… và không chuyển hướng trang web HTTP.

Tóm lại: tất cả các phiên bản khác nhau của trang web của bạn phải kết thúc ở cùng một nơi.

Website là gì
Sử dụng chuyển hướng 301

Chuyển hướng 301 là cách dễ nhất để khắc phục sự cố nội dung trùng lặp trên trang web của bạn.

(Bên cạnh việc xóa hoàn toàn các trang)

Vì vậy, nếu bạn tìm thấy một loạt các trang nội dung trùng lặp trên trang web của mình, hãy chuyển hướng chúng trở lại trang gốc.

Website là gì

Khi Googlebot ghé qua, nó sẽ xử lý chuyển hướng và CHỈ lập chỉ mục nội dung gốc.

(Điều này có thể giúp trang gốc đó bắt đầu xếp hạng)

Theo dõi nội dung tương tự

Nội dung trùng lặp KHÔNG CHỈ có nghĩa là nội dung được sao chép từng chữ từ một nơi khác.

Theo Google định nghĩa trùng lặp nội dung là:

Website là gì

Vì vậy, ngay cả khi nội dung của bạn khác về mặt kỹ thuật so với những gì hiện có, bạn vẫn có thể gặp phải các vấn đề về nội dung trùng lặp.

Đây không phải là vấn đề đối với hầu hết các trang web. Hầu hết các trang có vài chục trang. Và họ viết những thứ độc đáo cho mỗi trang.

Nhưng có những trường hợp nội dung trùng lặp “tương tự” có thể bị cắt xén.

Ví dụ: giả sử bạn điều hành một trang web dạy mọi người cách nói tiếng Pháp.

Và bạn phục vụ khu vực Boston lớn hơn.

Chà, bạn có thể có một trang dịch vụ được tối ưu hóa xung quanh từ khóa: “Học tiếng Pháp Boston”.

Website là gì

Và một trang khác đang cố gắng xếp hạng cho “Học tiếng Pháp Cambridge”.

Website là gì

Đôi khi nội dung về mặt kỹ thuật sẽ khác. Ví dụ: một trang có một vị trí được liệt kê cho vị trí Boston. Và trang kia có địa chỉ Cambridge.

Nhưng phần lớn, nội dung siêu giống nhau.

Website là gì

Đó là nội dung trùng lặp về mặt kỹ thuật.

Viết nội dung độc đáo 100% cho mỗi trang trên trang web của bạn có khó không? Đúng vậy. Nhưng nếu bạn nghiêm túc về việc xếp hạng mọi trang trên trang web của mình, thì đó là điều bắt buộc.

Xem thêm seo copywriting

Sử dụng thẻ hợp quy

Thẻ rel = canonical cho các công cụ tìm kiếm biết:

“Có, chúng tôi có một loạt các trang có nội dung trùng lặp. Nhưng trang NÀY là bản gốc. Bạn có thể bỏ qua phần còn lại ”.

Website là gì

Google đã nói rằng thẻ chuẩn tốt hơn là chặn các trang có nội dung trùng lặp.

Website là gì

(Ví dụ: chặn Googlebot bằng robots.txt hoặc bằng thẻ noindex trong HTML trang web của bạn)

Vì vậy, nếu bạn tìm thấy một loạt các trang trên trang web của mình có nội dung trùng lặp, bạn muốn:

  • Xóa chúng
  • Chuyển hướng chúng
  • Sử dụng thẻ chuẩn

Xem thêm canonical url

Sử dụng một công cụ

Có một số công cụ SEO có các tính năng được thiết kế để phát hiện nội dung trùng lặp.

Ví dụ: Siteliner quét trang web của bạn để tìm các trang chứa nhiều nội dung trùng lặp.

Website là gì
Hợp nhất các trang

Giống như tôi đã đề cập, nếu bạn có nhiều trang có nội dung trùng lặp, có thể bạn muốn chuyển hướng chúng đến một trang.

(Hoặc sử dụng thẻ chuẩn)

Nhưng nếu bạn có các trang có nội dung tương tự thì sao?

Chà, bạn có thể tạo ra nội dung độc đáo cho mọi trang… HOẶC hợp nhất chúng thành một trang lớn.

Ví dụ: giả sử bạn có 3 bài đăng blog trên trang web của mình khác nhau về mặt kỹ thuật… nhưng nội dung thì khá giống nhau.

Website là gì

Bạn có thể kết hợp 3 bài đăng đó thành một bài đăng blog tuyệt vời 100% là duy nhất.

Website là gì

Vì bạn đã xóa một số nội dung trùng lặp khỏi trang web của mình, nên trang đó sẽ xếp hạng tốt hơn 3 trang còn lại cộng lại.

Xem thêm cách bảo trì nội dung chất lương

Trang danh mục hoặc thẻ Noindex WordPress

Nếu bạn sử dụng WordPress, bạn có thể nhận thấy rằng nó tự động tạo các trang thẻ và danh mục.

Website là gì

Những trang này là nguồn nội dung trùng lặp LỚN.

Vì vậy, chúng hữu ích cho người dùng, tôi khuyên bạn nên thêm thẻ “noindex” vào các trang này. Bằng cách đó, chúng có thể tồn tại mà không cần công cụ tìm kiếm lập chỉ mục chúng.

Bạn cũng có thể thiết lập mọi thứ trong WordPress để các trang này không được tạo ra.

Xem thêm kỹ thuật seo cơ bản

Leave a Reply