Xem Chi Tiết Mục Lục Bài Viết
Tìm hiểu những trang nào của bạn đã được lập chỉ mục và mọi vấn đề Google gặp phải khi lập chỉ mục trang web của bạn.
Tôi có cần báo cáo này không?
[external_link_head]
Nếu trang web của bạn có dưới 500 trang, thì có lẽ bạn không cần sử dụng báo cáo này. Thay vào đó, hãy thử kiểm tra nhanh để xem trang web của bạn đã được lập chỉ mục hay chưa bằng cách tìm kiếm trên Google theo những cụm từ sau đây:
site:<<site_root_domain_or_path>>
– Xem một tập hợp con những trang mà Google đã biết trên trang web của bạn. Ví dụ:site:example.com
hoặcsite:example.com/cuahangthucung
site:<<your_site>> term1 term2
– Tìm những trang đã được lập chỉ mục và chứa một số cụm từ cụ thể trên trang web của bạn. Ví dụ:site:example.com/cuahangthucung meo cho
.site:<<exact-url>>
– Tìm URL chính xác của một trang trên trang web của bạn để xem Google đã lập chỉ mục trang đó hay chưa. Ví dụ:site:http://example.com/cuahangthucung/meo
BÁO CÁO PHẠM VI LẬP CHỈ MỤC
Trạng thái phạm vi lập chỉ mục trong Search Console – Chương trình đào tạo về Google Search Console
Tìm hiểu báo cáo
Bạn sẽ thấy báo cáo này dễ hiểu và hữu ích hơn nếu bạn đọc trước cách thức hoạt động của Google Tìm kiếm.
Báo cáo Phạm vi lập chỉ mục hiển thị trạng thái lập chỉ mục trong chỉ mục của Google cho mọi URL trong tài sản của bạn.
- Trang tóm tắt cấp cao nhất hiển thị kết quả cho mọi URL trong tài sản của bạn, được nhóm theo trạng thái (lỗi, cảnh báo, hoặc hợp lệ) và lý do cụ thể cho trạng thái đó (chẳng hạn như Không tìm thấy URL đã gửi (404))
- Hãy nhấp vào một hàng trong bảng trên trang tóm tắt để xem một trang chi tiết, nơi tập trung hiển thị thông tin về tất cả URL có cùng trạng thái/lý do.
Trang tóm tắt
Báo cáo cấp cao nhất cho biết trạng thái lập chỉ mục của tất cả các trang mà Google đã cố thu thập dữ liệu trên trang web của bạn, được nhóm theo trạng thái và nguyên nhân.
Trình thu thập dữ liệu chính
Giá trị Trình thu thập dữ liệu chính trên trang tóm tắt cho biết loại tác nhân người dùng mặc định mà Google sử dụng để thu thập dữ liệu trên trang web của bạn: Điện thoại thông minh hoặcMáy tính. Những trình thu thập này mô phỏng một khách truy cập đang sử dụng thiết bị di động hoặc máy tính, tùy theo loại tác nhân người dùng tương ứng.
Google thu thập dữ liệu tất cả các trang trên trang web của bạn bằng loại trình thu thập dữ liệu chính này. Google có thể thu thập thêm dữ liệu trên một nhóm nhỏ các trang của bạn bằng một trình thu thập dữ liệu phụ (đôi khi được gọi là trình thu thập dữ liệu thay thế). Đó chính là loại tác nhân người dùng còn lại. Ví dụ: nếu trình thu thập dữ liệu chính cho trang web của bạn là Điện thoại thông minh thì trình thu thập dữ liệu phụ sẽ là Máy tính; còn nếu trình thu thập dữ liệu chính là Máy tính thì trình thu thập dữ liệu phụ sẽ là Điện thoại thông minh. Mục đích của các lần thu thập dữ liệu phụ là cố gắng thu thập thêm dữ liệu về cách hoạt động của trang web khi người dùng truy cập trang trên một loại thiết bị khác.
Kết quả mong đợi
Lý tưởng nhất là bạn sẽ thấy số trang được lập chỉ mục hợp lệ tăng dần dần khi trang web của bạn phát triển thêm. Nếu bạn nhận thấy có sự sụt giảm hoặc gia tăng mạnh, hãy xem phần khắc phục vấn đề. Bảng trạng thái trên trang tóm tắt được phân nhóm và sắp xếp theo “trạng thái + lý do”.
Mục tiêu của bạn là khiến Google lập chỉ mục phiên bản chính tắc của mọi trang quan trọng. Mọi trang trùng lặp hoặc thay thế sẽ có nhãn “Bị loại trừ” trong báo cáo này. Về cơ bản, các trang trùng lặp hoặc thay thế có nội dung giống như trang chính tắc. Nếu bạn có một trang được đánh dấu là trùng lặp hoặc thay thế, thường thì đó là một dấu hiệu tốt;. Điều này có nghĩa là chúng tôi đã tìm thấy trang chính tắc và lập chỉ mục trang đó. Bạn có thể tìm thấy phiên bản chính tắc của mọi URL bằng cách chạy Công cụ kiểm tra URL. Tìm hiểu thêm về nguyên nhân khiến các trang có thể không xuất hiện trong chỉ mục.
Kết quả không nên mong đợi
- Phạm vi lập chỉ mục đạt 100%: Bạn không nên kỳ vọng Google sẽ lập chỉ mục tất cả URL trên trang web của bạn mà chỉ nên tập trung vào các trang chính tắc như được mô tả ở trên.
- Lập chỉ mục ngay lập tức: Khi bạn thêm nội dung mới, có thể mất vài ngày để Google lập chỉ mục nội dung đó. Bạn có thể giảm thời gian chờ lập chỉ mục bằng cách yêu cầu lập chỉ mục.
Trạng thái
Mỗi trang có thể có một trong các giá trị trạng thái sau:
- Lỗi : Trang này chưa được lập chỉ mục. Hãy xem phần mô tả về loại lỗi cụ thể để tìm hiểu thêm và nắm được cách sửa lỗi đó. Bạn nên tập trung vào những vấn đề này trước tiên.
- Cảnh báo : Trang này đã được lập chỉ mục, nhưng có một vấn đề bạn cần lưu ý.
- Bị loại trừ : Trang này chưa được lập chỉ mục, nhưng chúng tôi nghĩ đó là ý muốn của bạn. (Ví dụ: có thể bạn đã cố tình loại trừ trang này bằng lệnh noindex hoặc trang này có thể là bản trùng lặp của một trang chính tắc mà chúng tôi đã lập chỉ mục trên trang web của bạn.)
- Hợp lệ : Trang này đã được lập chỉ mục.
Lý do
Mỗi trạng thái (lỗi, cảnh báo, hợp lệ, bị loại trừ) đều có một nguyên nhân cụ thể. Hãy xem mục Mô tả loại trạng thái dưới đây để đọc phần mô tả về từng loại trạng thái và cách xử lý.
Xác thực
Trạng thái xác thực của vấn đề này. Bạn nên ưu tiên khắc phục các vấn đề có trạng thái xác thực “không thành công” hoặc “chưa bắt đầu”.
Giới thiệu về quy trình xác thực
Sau khi khắc phục tất cả các trường hợp của một vấn đề cụ thể trên trang web của mình, bạn có thể yêu cầu Google xác thực các thay đổi. Nếu tất cả các trường hợp đã biết biến mất thì vấn đề sẽ được đánh dấu là đã khắc phục trong bảng trạng thái và đưa xuống cuối bảng. Search Console theo dõi trạng thái xác thực của vấn đề nói chung, cũng như trạng thái của từng trường hợp trong vấn đề đó. Khi tất cả các trường hợp của vấn đề biến mất, vấn đề sẽ được coi là đã khắc phục. (Để biết các trạng thái thực tế được ghi lại, hãy xem Trạng thái xác thực vấn đề và Trạng thái xác thực trường hợp).
Thông tin khác về thời gian tồn tại của vấn đề…
Thời gian tồn tại của một vấn đề kéo dài từ lần đầu tiên phát hiện thấy bất kỳ trường hợp nào của vấn đề trên trang web của bạn cho đến 90 ngày sau khi trường hợp cuối cùng được đánh dấu là đã biến mất khỏi trang web. Nếu 90 ngày trôi qua mà không có trường hợp lặp lại nào, vấn đề sẽ bị xóa khỏi lịch sử báo cáo.
Ngày phát hiện đầu tiên của vấn đề là ngày đầu tiên phát hiện thấy vấn đề trong suốt thời gian tồn tại này và sẽ không thay đổi. Vì thế:
- Nếu tất cả các trường hợp của một vấn đề đã được khắc phục, nhưng một trường hợp mới của vấn đề xảy ra 15 ngày sau đó, vấn đề vẫn sẽ được đánh dấu là chưa khắc phục và ngày “phát hiện đầu tiên” vẫn là ngày ban đầu.
- Nếu vấn đề đó lặp lại sau 91 ngày kể từ khi trường hợp cuối cùng được khắc phục thì lúc này vấn đề trước đó đã được đóng lại. Do đó trường hợp này được ghi lại dưới dạng vấn đề mới, với ngày phát hiện đầu tiên được đặt thành “hôm nay”.
Quy trình xác thực cơ bản
Dưới đây là tổng quan về quy trình xác thực sau khi bạn nhấp vào Xác thực khắc phục cho một vấn đề. Quy trình này có thể mất vài ngày và bạn sẽ nhận được thông báo tiến độ qua email.
- Khi bạn nhấp vào Xác thực khắc phục, Search Console ngay lập tức kiểm tra một vài trang.
- Nếu vấn đề hiện tại xảy ra trên bất kỳ trang nào trong số này, quy trình xác thực sẽ kết thúc và trạng thái xác thực vẫn giữ nguyên.
- Nếu lỗi hiện tại không xảy ra trên các trang mẫu, quy trình xác thực sẽ tiếp tục với trạng thái Đã bắt đầu. Nếu quy trình tìm thấy các vấn đề không liên quan khác, những trường hợp đó được tính riêng với loại vấn đề này và việc xác thực vẫn tiếp tục.
- Search Console sẽ xem qua danh sách các URL đã biết bị ảnh hưởng bởi vấn đề này. Chỉ những URL mà trên đó xảy ra các trường hợp đã biết của vấn đề này mới được đưa vào hàng đợi để thu thập lại dữ liệu, không phải toàn bộ trang web. Search Console lưu giữ bản ghi về tất cả các URL đã kiểm tra trong lịch sử xác thực và bạn có thể truy cập vào lịch sử này từ trang chi tiết vấn đề.
- Khi Search Console kiểm tra một vấn đề:
- Nếu không tìm thấy vấn đề, trạng thái xác thực trường hợp sẽ thay đổi thành Đạt chuẩn. Nếu đây là trường hợp đầu tiên được kiểm tra sau khi xác thực bắt đầu, trạng thái xác thực vấn đề sẽ thay đổi thành Trông có vẻ ổn.
- Nếu URL không thể truy cập được, trạng thái xác thực trường hợp sẽ thay đổi thành Khác (không phải là trạng thái lỗi).
- Nếu trường hợp vẫn còn tồn tại, trạng thái vấn đề sẽ thay đổi thành Không đạt và quy trình xác thực kết thúc. Nếu đây là một trang mới được phát hiện qua quá trình thu thập dữ liệu bình thường, trang sẽ được xem là một trường hợp khác của vấn đề hiện tại này.
- Khi tất cả các lỗi và URL cảnh báo đã được kiểm tra và số lượng vấn đề là 0, trạng thái của vấn đề sẽ thay đổi thành Đã vượt qua. Lưu ý quan trọng: Ngay cả khi số trang bị ảnh hưởng giảm xuống còn 0 trang và trạng thái vấn đề thay đổi thành Đạt, nhãn mức độ nghiêm trọng sẽ vẫn xuất hiện (Lỗi hoặc Cảnh báo).
Ngay cả khi bạn không bao giờ nhấp vào “bắt đầu xác thực” Google vẫn có thể phát hiện thấy các trường hợp đã khắc phục của một vấn đề. Nếu phát hiện thấy tất cả các trường hợp của một vấn đã được khắc phục trong quá trình thu thập dữ liệu thông thường, Google sẽ thay đổi trạng thái vấn đề thành “N/A” (Không áp dụng) trên báo cáo.
Khi nào vấn đề được xem là “đã khắc phục” cho một URL hay một mục?
Vấn đề được đánh dấu là đã khắc phục cho một URL hoặc một mục khi đáp ứng một trong các điều kiện sau:
- Khi Google thu thập dữ liệu URL và không còn tìm thấy vấn đề trên trang. Đối với lỗi thẻ AMP, điều này có nghĩa là bạn đã khắc phục thẻ hoặc thẻ đã bị xóa (nếu thẻ không bắt buộc). Trong một lần xác thực, URL sẽ được xem là “đã vượt qua.”
- Nếu Google không thể truy cập vào trang vì bất kỳ lý do nào (trang đã bị xóa, trang có thẻ đánh dấu noindex, trang yêu cầu xác thực, v.v.), hệ thống sẽ xem là vấn đề đã được khắc phục cho URL đó. Trong một lần xác thực, trang sẽ được gán trạng thái xác thực là “khác”.
Xác thực lại
Khi bạn nhấp vào Xác thực lại cho một quy trình xác thực không thành công, quy trình sẽ bắt đầu lại với tất cả các trường hợp không thành công, cộng thêm bất kỳ trường hợp mới nào của vấn đề mà Google phát hiện thấy trong quá trình thu thập dữ liệu thông thường.
Bạn nên đợi chu kỳ xác thực hoàn tất trước khi yêu cầu một chu kỳ khác, ngay cả khi bạn đã khắc phục một số vấn đề trong chu kỳ hiện tại.
Các trường hợp đã đáp ứng quá trình xác thực (đánh dấu là Đạt) hoặc không truy cập được nữa (đánh dấu là Khác) sẽ không được kiểm tra lại và sẽ bị xóa khỏi nhật ký khi bạn nhấp vào Xác thực lại.
Lịch sử xác thực
Bạn có thể xem tiến trình của yêu cầu xác thực bằng cách nhấp vào liên kết chi tiết xác thực trong trang chi tiết vấn đề.
[external_link offset=1]
Các mục trong lịch sử xác thực được nhóm theo URL cho báo cáo AMP và báo cáo Trạng thái lập chỉ mục. Trong báo cáo Khả năng sử dụng trên thiết bị di động và Kết quả nhiều định dạng, các mục được nhóm theo kết hợp URL + mục dữ liệu có cấu trúc (như được xác định bởi giá trị Tên của mục). Trạng thái xác thực sẽ áp dụng cho vấn đề cụ thể mà bạn đang kiểm tra. Bạn có thể thấy một vấn đề gắn nhãn “Đã vượt qua” trên một trang, nhưng các vấn đề khác lại bị gắn nhãn “Không đạt”, “Đang chờ xử lý” hoặc “Khác”.
Trạng thái xác thực vấn đề
Các trạng thái xác thực sau đây áp dụng cho một vấn đề nhất định:
- Chưa bắt đầu: Có một hoặc nhiều trang xảy ra một trường hợp của vấn đề này và bạn chưa hề bắt đầu xác thực các trang đó. Các bước tiếp theo:
- Nhấp vào vấn đề để tìm hiểu chi tiết lỗi. Hãy kiểm tra các trang riêng lẻ để xem ví dụ về lỗi trên trang trực tuyến bằng cách sử dụng quy trình Kiểm tra AMP. (Nếu quy trình Kiểm tra AMP không hiển thị lỗi trên trang thì đó là vì bạn đã sửa lỗi trên trang thực tế sau khi Google tìm thấy lỗi và tạo báo cáo vấn đề này).
- Nhấp vào “Tìm hiểu thêm” trên trang chi tiết để xem chi tiết về quy tắc bị vi phạm.
- Nhấp vào dòng URL ví dụ trong bảng để biết chi tiết về lỗi cụ thể đó.
- Sửa lỗi các trang của bạn rồi nhấp vào Xác thực khắc phục để Google thu thập lại dữ liệu các trang của bạn. Google sẽ thông báo cho bạn về tiến trình xác thực. Quá trình xác thực thường mất tối đa khoảng hai tuần, tuy vậy một số trường hợp có thể mất nhiều thời gian hơn, vì vậy, xin hãy kiên nhẫn.
- Đã bắt đầu: Bạn đã bắt đầu một lượt xác thực và Google chưa tìm thấy trường hợp còn lại nào của vấn đề. Bước tiếp theo: Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết việc bạn cần làm, nếu cần thiết.
- Trông có vẻ ổn: Bạn đã bắt đầu xác thực và tất cả các trường hợp của vấn đề mà Google đã kiểm tra đến giờ đều đã được khắc phục. Bước tiếp theo: Bạn không cần phải làm gì, nhưng Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết việc bạn cần làm.
- Đã vượt qua: Tất cả các trường hợp đã biết của vấn đề đã biến mất (hoặc URL bị ảnh hưởng không còn truy cập được nữa). Bạn hẳn đã nhấp vào “Xác thực khắc phục” để có được trạng thái này (nếu trường hợp biến mất khi bạn chưa yêu cầu xác thực, trạng thái sẽ thay đổi thành N/A). Bước tiếp theo: Bạn không cần phải làm gì khác.
- Không có: Google nhận thấy rằng vấn đề đã được khắc phục trên tất cả các URL, ngay cả khi bạn chưa hề bắt đầu xác thực. Bước tiếp theo: Bạn không cần phải làm gì khác.
- Không thành công: Một số trang nhất định vẫn có vấn đề này sau khi bạn nhấp vào “Xác thực”. Bước tiếp theo: Khắc phục vấn đề và xác thực lại.
Trạng thái xác thực trường hợp
Sau khi bạn yêu cầu xác thực, mọi trường hợp của vấn đề đều được chỉ định một trong các trạng thái xác thực sau đây:
- Đang chờ xác thực: Đã đưa vào hàng đợi để xác thực. Trong lần cuối cùng Google kiểm tra, trường hợp này của vấn đề vẫn tồn tại.
- Đã vượt qua: [Không hiển thị trong tất cả báo cáo] Google đã kiểm tra trường hợp của vấn đề và trường hợp không còn tồn tại. Bạn chỉ có thể đạt được trạng thái này nếu đã thể hiện rõ thao tác nhấp vào Xác thực cho trường hợp này.
- Không đạt: Google đã kiểm tra trường hợp này của vấn đề và trường hợp vẫn tồn tại. Bạn chỉ có thể đạt được trạng thái này nếu đã nhấp vào Xác thực một cách rõ ràng cho trường hợp này.
- Khác: [Không hiển thị trong tất cả báo cáo] Google không thể truy cập vào URL có trường hợp này hoặc không thể tìm thấy mục trên trang nữa (đối với dữ liệu có cấu trúc). Được xem là trạng thái tương đương với Đạt.
Xin lưu ý rằng cùng một URL có thể có nhiều trạng thái tùy theo loại vấn đề. Ví dụ: nếu một trang có cả vấn đề X và vấn đề Y, thì vấn đề X có thể thuộc trạng thái xác thực Đạt trong khi vấn đề Y trên chính trang đó có thể thuộc trạng thái xác thực Đang chờ xử lý.
Bộ lọc thả xuống theo phương thức phát hiện URL
Bạn có thể sử dụng bộ lọc thả xuống phía trên biểu đồ để lọc kết quả lập chỉ mục theo cách Google phát hiện ra URL. Bộ lọc này có những giá trị sau:
- Tất cả các trang đã biết [Mặc định] – Hiển thị tất cả các URL mà Google đã phát hiện được bằng bất kỳ phương thức nào.
- Tất cả các trang đã gửi – Chỉ hiển thị các trang đã gửi đến báo cáo này qua một sơ đồ trang web hoặc lệnh ping sơ đồ trang web.
- URL trong một sơ đồ trang web cụ thể – Chỉ hiển thị các URL có trong một sơ đồ trang web cụ thể đã gửi qua báo cáo này. Dữ liệu này bao gồm mọi URL có trong các sơ đồ trang web được lồng trong báo cáo.
Một URL được xem là đã gửi qua sơ đồ trang web ngay cả khi Google đã phát hiện thấy URL đó bằng cơ chế khác (ví dụ như bằng cách thu thập dữ liệu tự nhiên từ trang khác).
Trang chi tiết
Hãy nhấp vào một hàng trên trang tóm tắt để mở trang chi tiết về trạng thái + lý do. Bạn có thể xem thông tin chi tiết về vấn đề đã chọn bằng cách nhấp vào phần Tìm hiểu thêm ở đầu trang.
Biểu đồ trên trang này cho thấy số trang bị ảnh hưởng theo thời gian.
Bảng hiển thị danh sách ví dụ về những trang chịu ảnh hưởng của trạng thái + lý do này. Bạn có thể nhấp vào những thành phần trong hàng như sau:
Giá trị Nguồn trên trang chi tiết cho biết loại tác nhân người dùng (Điện thoại thông minh hoặc Máy tính) mà Google sử dụng để thu thập dữ liệu những URL trong danh sách.
Sau khi bạn khắc phục xong mọi trường hợp lỗi hoặc cảnh báo, hãy nhấp vào Xác thực bản sửa lỗi để báo cho Google về việc bạn đã khắc phục xong vấn đề.
Bạn thấy một URL bị đánh dấu là đang gặp phải một vấn đề mà bạn đã khắc phục? Có lẽ bạn đã khắc phục vấn đề SAU lần thu thập dữ liệu mới nhất của Google. Vì thế, nếu bạn thấy URL có một vấn đề mà bạn đã khắc phục, hãy kiểm tra ngày thu thập dữ liệu cho URL đó: Hãy kiểm tra và xác nhận kết quả sửa lỗi, sau đó yêu cầu Google lập chỉ mục lại
Chia sẻ báo cáo
Bạn có thể chia sẻ trang chi tiết vấn đề trong báo cáo phạm vi lập chỉ mục hoặc tính năng nâng cao bằng cách nhấp vào nút Chia sẻ trên trang. Đường liên kết này chỉ cho phép người có đường liên kết truy cập vào trang chi tiết vấn đề hiện tại và mọi trang lịch sử xác thực cho vấn đề này. Đường liên kết này không cấp quyền truy cập vào các trang khác về tài nguyên của bạn hoặc cho phép người dùng được chia sẻ thực hiện bất kỳ hành động nào đối với sản phẩm hay tài khoản của bạn. Bạn có thể thu hồi liên kết bất kỳ lúc nào bằng cách vô hiệu hóa chia sẻ cho trang này.
Xuất dữ liệu báo cáo
Nhiều báo cáo có nút xuất để xuất dữ liệu báo cáo. Dữ liệu biểu đồ và dữ liệu bảng sẽ đều được xuất. Những giá trị hiển thị dưới dạng ~ hoặc – trong báo cáo (không có sẵn/không phải số) sẽ đều là số 0 trong dữ liệu được tải xuống.
Khắc phục sự cố
Bạn có thể xác nhận trạng thái lập chỉ mục của mọi URL hiển thị trong báo cáo này bằng cách kiểm tra URL:
- Quyết định xem trạng thái lập chỉ mục có thực sự là vấn đề hay không dựa trên loại trạng thái, mục tiêu lập chỉ mục và lỗi cụ thể.
- Đọc thông tin cụ thể về vấn đề.
- Kiểm tra URL bằng Công cụ kiểm tra URL.
- Nhấp vào biểu tượng kiểm tra
bên cạnh URL trong bảng ví dụ để mở công cụ Kiểm tra URL cho URL đó.
- Xem thông tin chi tiết về hoạt động thu thập dữ liệu và lập chỉ mục cho URL đó tại phần Phạm vi lập chỉ mục > Thu thập dữ liệu và Phạm vi lập chỉ mục > Lập chỉ mục trong báo cáo Kiểm tra URL.
- Để kiểm tra phiên bản đang hoạt động của trang, hãy nhấp vào Kiểm tra URL đang hoạt động.
- Nhấp vào biểu tượng kiểm tra
Các sự cố thường gặp:
Dưới đây là một số vấn đề phổ biến nhất về việc lập chỉ mục mà bạn có thể thấy trong báo cáo này:
Tổng số trang được lập chỉ mục giảm mà không có lỗi tương ứng
Nếu bạn thấy tổng số trang được lập chỉ mục bị giảm nhưng số lỗi lại không gia tăng ở mức tương ứng, thì có thể là do bạn đang chặn quyền truy cập vào các trang hiện có thông qua tệp robots.txt, lệnh “noindex” hoặc một yêu cầu đăng nhập bắt buộc. Hãy kiểm tra xem số URL Bị loại trừ có tăng ở mức tương ứng với mức sụt giảm số trang Hợp lệ hay không. Hãy lưu ý rằng nếu được gửi qua một sơ đồ trang web thì những URL này sẽ được đánh dấu là lỗi chứ không phải là bị loại trừ.
Số trang Bị loại trừ nhiều hơn số trang Hợp lệ
Nếu số trang Bị loại trừ lớn hơn số trang Hợp lệ, hãy xem nguyên nhân cho trạng thái Bị loại trừ. Các lý do loại trừ phổ biến bao gồm:
- Có một quy tắc robots.txt đang chặn Google thu thập dữ liệu nhiều trang trên trang web của bạn. Hãy bỏ chặn nếu bạn đang chặn nhầm trang.
- Trang web của bạn có số lượng lớn các trang trùng lặp, có thể là do trang web sử dụng các tham số để lọc hoặc sắp xếp một tập hợp chung (ví dụ:
type=dress
,color=green
hoặcsort=price
). Các trang này có thể sẽ bị loại trừ nếu chúng chỉ hiển thị nội dung giống nhau được sắp xếp, lọc hoặc tiếp cận theo các cách khác nhau. Nếu bạn là người dùng nâng cao và bạn nghĩ rằng Google đang hiểu nhầm các tham số trên trang web của bạn, hãy sử dụng công cụ Tham số URL để tùy chỉnh cách xử lý các tham số trên trang web.
Lỗi tăng đột biến
Nếu bạn thấy số lỗi tăng đột biến, thì lý do có thể là một thay đổi trong mẫu của bạn gây ra lỗi mới hoặc có thể bạn đã gửi một sơ đồ trang web có chứa các URL bị chặn khỏi quá trình thu thập dữ liệu do tệp robots.txt, lệnh noindex hay yêu cầu đăng nhập.
Nếu bạn thấy số lỗi tăng đột biến, hãy:
- Kiểm tra xem liệu có sự tương quan nào giữa tổng số lỗi lập chỉ mục hoặc tổng số trang đã lập chỉ mục và biểu đồ thu nhỏ
bên cạnh một hàng lỗi cụ thể trên trang tóm tắt hay không để biết được vấn đề nào có thể đang ảnh hưởng đến tổng số lỗi hay tổng số trang đã lập chỉ mục.
- Nhấp vào trang chi tiết để tìm những lỗi có vẻ như đang góp phần khiến số lỗi tăng vọt. Đọc mô tả về loại lỗi cụ thể để tìm hiểu cách xử lý tốt nhất.
- Hãy nhấp vào một vấn đề và kiểm tra một trang ví dụ để xem lỗi đó là gì (nếu cần thiết).
- Khắc phục tất cả các trường hợp của mỗi lỗi và yêu cầu xác thực bằng cách nhấp vào Xác thực khắc phục trong trang chi tiết cho nguyên nhân đó. Đọc thêm về quy trình xác thực.
- Bạn sẽ nhận được thông báo khi quy trình xác thực diễn ra, nhưng bạn có thể kiểm tra lại sau vài ngày để xem liệu số lỗi đã giảm hay chưa.
Lỗi máy chủ
Lỗi máy chủ nghĩa là Googlebot không thể truy cập URL của bạn, yêu cầu đã hết thời gian chờ hoặc trang web của bạn đang quá tải. Kết quả là Googlebot bắt buộc phải từ bỏ yêu cầu.
Kiểm tra khả năng kết nối với máy chủ
Bạn có thể sử dụng Công cụ kiểm tra URL để xem liệu bạn có thể tái hiện một lỗi máy chủ trong báo cáo Phạm vi lập chỉ mục hay không.
Sửa lỗi về khả năng kết nối với máy chủ
- Giảm hoạt động tải trang quá mức đối với các yêu cầu trang động.
Một trang web được xem là phân phát nội dung động nếu trang web đó cung cấp cùng một nội dung cho nhiều URL (ví dụ:www.example.com/shoes.php?color=red&size=7
cung cấp cùng một nội dung nhưwww.example.com/shoes.php?size=7&color=red
). Các trang động cũng có thể mất nhiều thời gian để phản hồi, dẫn đến các vấn đề hết thời gian chờ. Hoặc máy chủ có thể trả về trạng thái quá tải để yêu cầu Googlebot thu thập dữ liệu trang web chậm hơn. Nói chung, chúng tôi khuyên bạn nên đặt các tham số ngắn và sử dụng chúng một cách thận trọng. Nếu chắc chắn về cách các tham số hoạt động cho trang web của mình, bạn có thể cho Google biết nên xử lý những tham số này theo cách nào. - Đảm bảo rằng máy chủ lưu trữ trang web của bạn không bị trục trặc, quá tải hay định cấu hình sai cách.
Nếu vấn đề kết nối, hết thời gian chờ hoặc phản hồi vẫn tiếp diễn, hãy kiểm tra với nhà cung cấp dịch vụ lưu trữ web và cân nhắc tăng khả năng xử lý lưu lượng truy cập cho trang web của bạn. - Kiểm tra để đảm bảo bạn không vô tình chặn Google.
Bạn có thể đang chặn Google do một vấn đề cấp hệ thống, chẳng hạn như vấn đề cấu hình DNS, tường lửa hay hệ thống bảo vệ DoS được định cấu hình không đúng cách hoặc cấu hình hệ thống quản lý nội dung. Hệ thống bảo vệ là một phần quan trọng của lưu trữ an toàn và thường được định cấu hình để tự động chặn các yêu cầu máy chủ ở mức cao bất thường. Tuy nhiên, do thường tạo ra nhiều yêu cầu hơn người dùng là con người nên Googlebot có thể kích hoạt các hệ thống bảo vệ này, dẫn đến các hệ thống này chặn Googlebot và ngăn Googlebot thu thập dữ liệu trang web của bạn. Để khắc phục các sự cố đó, hãy xác định phần nào trong cơ sở hạ tầng của trang web của bạn đang chặn Googlebot rồi bỏ chặn. Tường lửa có thể không thuộc quyền kiểm soát của bạn do đó bạn cần thảo luận việc này với nhà cung cấp dịch vụ lưu trữ của mình. - Kiểm soát hoạt động thu thập dữ liệu và lập chỉ mục trang web của công cụ tìm kiếm một cách hợp lý.
Một số quản trị viên web chủ định ngăn Googlebot truy cập trang web của họ, có thể là bằng cách sử dụng tường lửa như được mô tả ở trên. Trong những trường hợp này, mục đích thường không phải là chặn hoàn toàn Googlebot mà là kiểm soát cách trang web được thu thập dữ liệu và lập chỉ mục. Nếu điều này đúng với bạn, hãy kiểm tra các điều sau:- Để kiểm soát việc Googlebot thu thập dữ liệu nội dung của bạn, hãy sử dụng tệp robots.txt và định cấu hình các tham số URL.
- Nếu lo ngại về việc các bot xấu sử dụng tác nhân người dùng Googlebot, bạn có thể xác minh xem trình thu thập dữ liệu có thực sự là Googlebot không.
- Nếu muốn thay đổi tần suất Googlebot thu thập dữ liệu trang web của mình, bạn có thể yêu cầu thay đổi tốc độ thu thập dữ liệu của Googlebot. Nhà cung cấp dịch vụ lưu trữ cũng có thể xác minh quyền sở hữu đối với các địa chỉ IP của họ để cho phép bạn yêu cầu.
Lỗi 404
Nói chung, bạn chỉ nên sửa các trang lỗi và bỏ qua các trang bị loại trừ. Các trang có lỗi 404 là những trang mà bạn đã yêu cầu Google lập chỉ mục nhưng Google lại không tìm thấy trang đó. Trường hợp này hiển nhiên là một lỗi. Các trang bị loại trừ 404 là những trang mà Google tìm thấy bằng một cơ chế khác, chẳng hạn như đường liên kết từ một trang khác. Nếu trang đã di chuyển, bạn nên sẽ trả về một lệnh chuyển hướng 3XX đến trang mới. Tìm hiểu thêm về cách đánh giá và sửa lỗi 404.
Trang hoặc trang web không có trong báo cáo
Nếu trang của bạn hoàn toàn không có trong báo cáo, thì điều này có thể do một trong những nguyên nhân sau:
- Google không biết về trang này. Sau đây là một số lưu ý về khả năng phát hiện trang:
- Nếu đây là một trang/trang web mới, hãy lưu ý rằng có thể mất một thời gian để Google tìm thấy và thu thập dữ liệu trên những trang/trang web đó.
- Để Google tìm thấy một trang, bạn phải gửi sơ đồ trang web hoặc yêu cầu thu thập dữ liệu trang, hoặc Google phải tìm thấy đường liên kết đến trang của bạn ở một nơi nào đó.
- Sau khi tìm thấy URL của một trang, có thể mất một thời gian (tối đa một vài tuần) để Google thu thập dữ liệu một phần hoặc toàn bộ trang web của bạn.
- Google không bao giờ lập chỉ mục ngay, kể cả khi bạn đã trực tiếp gửi yêu cầu lập chỉ mục.
- Google không đảm bảo tất cả các trang ở mọi nơi sẽ có trong Chỉ mục của Google.
- Google không thể truy cập vào trang của bạn (trang này yêu cầu đăng nhập hoặc hạn chế quyền truy cập đối với một số người dùng trên Internet)
- Trang có một thẻ noindex và thẻ này đã ngăn Google lập chỉ mục trang đó
- Trang đã bị loại bỏ khỏi chỉ mục vì một lý do nào đó.
Để sửa lỗi:
Sử dụng Công cụ kiểm tra URL để kiểm tra vấn đề trên trang của bạn. Nếu trang không có trong báo cáo Phạm vi lập chỉ mục nhưng lại nằm trong danh sách đã lập chỉ mục trong báo cáo Kiểm tra URL, thì có lẽ Google chỉ mới lập chỉ mục trang trong thời gian gần đây và trang sẽ sớm xuất hiện trong báo cáo Phạm vi lập chỉ mục. Nếu trang thuộc danh sách chưa lập chỉ mục trong Công cụ kiểm tra URL (đúng như suy đoán của bạn), hãy kiểm tra trang đang hoạt động. Kết quả kiểm tra trang đang hoạt động sẽ cho bạn biết vấn đề cụ thể là gì: hãy dùng thông tin trong kết quả kiểm tra và tài liệu kiểm tra để tìm hiểu cách khắc phục vấn đề.
Lỗi “Đã gửi” và các trường hợp bị loại trừ
Nếu bạn thấy có từ “Đã gửi” trong tiêu đề cho lý do lập chỉ mục (ví dụ: “URL đã gửi trả về lỗi 403”), thì nghĩa là URL đó có trong một sơ đồ trang web mà tệp robots.txt của bạn tham chiếu đến hoặc được gửi qua báo cáo Sơ đồ trang web.
Để khắc phục vấn đề “Đã gửi”:
- Khắc phục vấn đề đang ngăn Google thu thập dữ liệu trên trang
hoặc - Xóa URL khỏi sơ đồ trang web của bạn và gửi lại sơ đồ đó trong báo cáo Sơ đồ trang web (cách nhanh nhất)
hoặc - Sử dụng báo cáo Sơ đồ trang web để xóa mọi sơ đồ trang web có chứa URL đó (và đảm bảo rằng không có sơ đồ trang web nào trong tệp robots.txt của bạn có chứa URL này).
Câu hỏi thường gặp
Tại sao trang của tôi có trong chỉ mục? Tôi không muốn trang được lập chỉ mục.
Google có thể lập chỉ mục bất kỳ URL nào đã tìm thấy trừ khi bạn bao gồm lệnh noindex trên trang (hoặc trang đã bị chặn tạm thời). Google có thể tìm thấy một trang theo nhiều cách, bao gồm cả việc ai đó liên kết đến trang của bạn từ một trang web khác.
- Nếu muốn chặn trang của mình khỏi kết quả Google Tìm kiếm, bạn có thể yêu cầu một số hình thức đăng nhập cho trang hoặc sử dụng lệnh noindex trên trang.
- Nếu muốn xóa trang của mình khỏi kết quả Google Tìm kiếm sau khi Google đã tìm thấy trang, bạn sẽ cần phải làm theo các bước sau.
Tại sao gần đây Google chưa lập chỉ mục lại trang web của tôi?
Google lập chỉ mục lại các trang dựa trên một số tiêu chí, bao gồm cả tần suất thay đổi của trang theo phỏng đoán của Google. Nếu trang web của bạn không thay đổi thường xuyên, thì có thể tốc độ làm mới với trang là chậm hơn. Do đó, bạn không cần phải lo lắng nếu trang chưa thay đổi. Nếu bạn nghĩ rằng trang web của bạn cần được làm mới, hãy yêu cầu Google thu thập lại dữ liệu đối với trang.
Google có thể thu thập lại dữ liệu về trang/trang web của tôi không?
Yêu cầu Google thu thập lại dữ liệu đối với trang.
Tại sao nhiều trang của tôi bị loại trừ?
Hãy xem chi tiết về các lý do loại trừ trong báo cáo Phạm vi lập chỉ mục. Hầu hết các trường hợp loại trừ là do một trong những nguyên nhân sau:
- Có một quy tắc robots.txt đang chặn chúng tôi thu thập dữ liệu các phần lớn trên trang web của bạn. Hãy sử dụng công cụ Kiểm tra URL để xác nhận vấn đề.
- Trang web của bạn có số lượng lớn các trang trùng lặp, thường là do trang sử dụng các tham số để lọc hoặc sắp xếp một tập hợp chung (ví dụ:
type=dress
hoặccolor=green
hoặcsort=price
). Các trang này sẽ bị gắn nhãn là “trùng lặp” hoặc “thay thế” trong báo cáo Phạm vi lập chỉ mục. - URL chuyển hướng đến một URL khác. URL chuyển hướng không được lập chỉ mục nhưng trang đích của lệnh chuyển hướng lại được lập chỉ mục.
Google không thể truy cập sơ đồ trang web của tôi
Hãy đảm bảo rằng sơ đồ trang web của bạn là hợp lệ, không bị tệp robots.txt chặn, và bạn đang sử dụng URL thích hợp trong tệp robots.txt hoặc báo cáo Sơ đồ trang web. Bạn có thể kiểm tra URL sơ đồ trang web của bạn bằng một công cụ kiểm tra sơ đồ trang web có sẵn công khai.
Tại sao Google tiếp tục thu thập dữ liệu một trang đã bị xóa?
Google tiếp tục thu thập dữ liệu tất cả các URL đã biết ngay cả sau khi chúng trả lại lỗi 4XX trong một thời gian, để phòng trường hợp đó là lỗi tạm thời. Trường hợp duy nhất mà chúng tôi không thu thập dữ liệu một URL là khi trang đó trả về lệnh noindex.
Để tránh hiển thị cho bạn danh sách lỗi 404 ngày càng tăng, báo cáo Phạm vi lập chỉ mục chỉ hiển thị các URL đã hiển thị lỗi 404 trong tháng qua.
Tôi có thể xem trang của mình, tại sao Google không thể?
Hãy sử dụng công cụ Kiểm tra URL để xem liệu Google có thể xem trang đang hoạt động không. Nếu không thể thì Google sẽ cho biết lý do. Nếu Google có thể xem trang thì vấn đề có thể là lỗi truy cập đã được khắc phục kể từ lần thu thập dữ liệu gần nhất. Hãy chạy quy trình thu thập dữ liệu với trang đang hoạt động bằng công cụ Kiểm tra URL và yêu cầu lập chỉ mục.
Công cụ Kiểm tra URL cho thấy không có vấn đề gì, nhưng báo cáo Phạm vi lập chỉ mục lại hiển thị lỗi. Vì sao lại thế?
Bạn có thể đã sửa lỗi sau lần gần nhất mà Google thu thập dữ liệu trang. Hãy xem ngày mà Google thu thập dữ liệu URL của bạn (ngày này có thể hiển thị trên trang chi tiết URL trong báo cáo Phạm vi lập chỉ mục hoặc hiển thị trong chế độ xem phiên bản đã lập chỉ mục trong công cụ Kiểm tra URL). Hãy xác định xem bạn có khắc phục lỗi nào kể từ lần thu thập dữ liệu gần nhất không.
Làm cách nào để tìm trạng thái lập chỉ mục của một URL cụ thể?
Để tìm hiểu trạng thái lập chỉ mục của một URL cụ thể, hãy sử dụng công cụ Kiểm tra URL. Bạn không thể tìm kiếm hoặc lọc theo URL trong báo cáo Phạm vi lập chỉ mục.
Nguyên nhân của trạng thái
Báo cáo Phạm vi lập chỉ mục hiển thị những trạng thái sau:
[external_link offset=2]
Lỗi
Google chưa lập chỉ mục các trang có lỗi
Lỗi máy chủ (5xx): Máy chủ của bạn đã trả về lỗi cấp 500 khi có yêu cầu về trang. Hãy xem phần Sửa lỗi máy chủ.
Lỗi chuyển hướng: Google gặp phải lỗi chuyển hướng thuộc một trong các loại sau: Chuỗi chuyển hướng quá dài; vòng lặp chuyển hướng; URL chuyển hướng vượt quá độ dài URL tối đa; có URL không hợp lệ hoặc trống trong chuỗi chuyển hướng. Hãy sử dụng một công cụ gỡ lỗi web, chẳng hạn như Lighthouse, để biết thêm chi tiết về vấn đề chuyển hướng đó.
URL đã gửi bị chặn bởi robots.txt: Bạn đã gửi trang này để lập chỉ mục, nhưng trang bị tệp robots.txt trên trang web của bạn chặn.
- Nhấp vào trang trong bảng Ví dụ để mở rộng bảng điều khiển bên của công cụ.
- Nhấp vào Kiểm tra lệnh chặn trong robots.txt để chạy trình kiểm tra robot.txt đối với URL đó. Công cụ sẽ chỉ rõ quy tắc đang chặn URL đó.
- Cập nhật tệp robots.txt của bạn để xóa hoặc thay đổi quy tắc này, nếu phù hợp. Bạn có thể tìm vị trí của tệp này bằng cách nhấp vào Xem robots.txt trực tiếp trên công cụ kiểm tra robots.txt. Nếu bạn đang sử dụng dịch vụ lưu trữ web và không có quyền sửa đổi tệp này, hãy tìm tài liệu của dịch vụ mà bạn sử dụng hoặc liên hệ với trung tâm trợ giúp của họ để thông báo cho họ về vấn đề.
URL đã gửi được đánh dấu ‘noindex’: Bạn đã gửi trang này để lập chỉ mục, nhưng trang có lệnh ‘noindex’ trong thẻ meta hoặc tiêu đề HTTP. Nếu muốn Google lập chỉ mục trang này, bạn phải xóa thẻ hoặc tiêu đề HTTP đó. Hãy sử dụng công cụ Kiểm tra URL để xác nhận lỗi:
- Nhấp vào biểu tượng kiểm tra
bên cạnh URL trong bảng.
- Trong phần Trạng thái lập chỉ mục > Lập chỉ mục > Được phép lập chỉ mục?, báo cáo sẽ cho biết lệnh noindex đang ngăn Google lập chỉ mục.
- Xác nhận rằng thẻ noindex vẫn tồn tại trong phiên bản đang hoạt động:
- Nhấp vào Kiểm tra URL đang hoạt động
- Trong phần Khả năng lập chỉ mục > Lập chỉ mục > Được phép lập chỉ mục?, hãy xem còn có lệnh noindex hay không. Nếu lệnh noindex không còn nữa, bạn có thể nhấp vào Yêu cầu lập chỉ mục để yêu cầu Google thử lập chỉ mục trang lần nữa. Nếu lệnh noindex vẫn còn, bạn phải xóa lệnh đó để chúng tôi có thể lập chỉ mục trang.
URL đã gửi có vẻ đang gặp lỗi 404 mềm: Bạn đã gửi trang này để lập chỉ mục, nhưng máy chủ có vẻ đã trả về lỗi 404 mềm. Tìm hiểu cách khắc phục sự cố này.
URL đã gửi trả về yêu cầu không được ủy quyền (401): Bạn đã gửi trang này để lập chỉ mục, nhưng Google nhận được phản hồi 401 (không được ủy quyền). Hãy xóa yêu cầu ủy quyền cho trang này hoặc cho phép Googlebot truy cập vào các trang của bạn bằng cách xác minh danh tính. Bạn có thể xác minh lỗi này bằng cách truy cập trang ở chế độ ẩn danh.
Không tìm thấy URL đã gửi (404): Bạn đã gửi một URL không tồn tại để lập chỉ mục. Hãy xem phần Sửa lỗi 404.
URL đã gửi trả về lỗi 403: URL đã gửi yêu cầu quyền truy cập dựa trên ủy quyền, nhưng Google không có thông tin đăng nhập. Nếu bạn muốn chúng tôi lập chỉ mục trang này, vui lòng cấp quyền truy cập cho khách truy cập ẩn danh; nếu không thì bạn không nên gửi trang này để lập chỉ mục.
URL đã gửi bị chặn do lỗi 4xx khác: Máy chủ trả về mã phản hồi 4xx không thuộc bất kỳ loại vấn đề nào đã nêu ở đây cho URL đã gửi. Bạn nên sửa lỗi này hoặc đừng gửi URL này để lập chỉ mục. Hãy thử gỡ lỗi trang của bạn bằng Công cụ kiểm tra URL.
Cảnh báo
Các trang có trạng thái cảnh báo có thể cần bạn chú ý và có thể đã được lập chỉ mục hoặc chưa, tùy theo kết quả cụ thể.
Đã lập chỉ mục mặc dù bị chặn bằng robots.txt: Trang đã được lập chỉ mục mặc dù bị chặn bằng tệp robots.txt trên trang web của bạn. (Google luôn tuân theo robots.txt, nhưng tệp này sẽ không ngăn được Google lập chỉ mục trang của bạn nếu một trang khác có đường liên kết đến trang của bạn). Chúng tôi không biết chắc liệu bạn có ý định chặn trang khỏi kết quả tìm kiếm hay không:
- Nếu bạn muốn chặn trang này thì robots.txt không phải là cơ chế thích hợp để ngăn Google lập chỉ mục. Để ngăn Google lập chỉ mục, bạn nên sử dụng lệnh ‘noindex’ hoặc hạn chế quyền truy cập vào trang bằng cách yêu cầu người dùng đăng nhập. Bạn có thể sử dụng trình kiểm tra robots.txt để xác định quy tắc nào đang chặn trang này. Do quy tắc robots.txt mà có thể kết quả của Google Tìm kiếm liên quan đến trang có thể sẽ chứa rất ít đoạn trích.
- Nếu bạn không muốn chặn trang này, hãy cập nhật tệp robots.txt để bỏ chặn trang.
Đã lập chỉ mục nhưng không thể đọc nội dung: Trang này xuất hiện trong chỉ mục của Google nhưng Google không thể đọc nội dung trang vì lý do nào đó. Các lý do có thể là trang bị che giấu với Google hoặc trang ở định dạng mà Google không thể lập chỉ mục. Lý do không phải là lệnh chặn trong robots.txt.
Hợp lệ
Các trang có trạng thái hợp lệ đã được lập chỉ mục.
Đã được gửi và lập chỉ mục: Bạn đã gửi URL để lập chỉ mục và Google đã lập chỉ mục trang.
Đã được lập chỉ mục, chưa được gửi trong sơ đồ trang web: Google đã phát hiện và lập chỉ mục URL. Bạn nên gửi tất cả các URL quan trọng bằng cách sử dụng sơ đồ trang web.
Bị loại trừ
Các trang này thường không được lập chỉ mục, nhưng chúng tôi nghĩ điều đó là phù hợp. Các trang này trùng lặp với các trang được lập chỉ mục, bị một số cơ chế trên trang web của bạn chặn lập chỉ mục hoặc không được lập chỉ mục vì một lý do mà chúng tôi cho rằng không phải là lỗi.
Bị loại trừ bởi thẻ ‘noindex’: Khi cố gắng lập chỉ mục trang, Google đã gặp phải lệnh ‘noindex’ và do đó không lập chỉ mục trang. Nếu không muốn Google lập chỉ mục trang này thì bạn đã đạt được mục đích của mình. Còn nếu muốn Google lập chỉ mục trang thì bạn nên xóa lệnh ‘noindex’ đó. Để xác nhận sự hiện diện của thẻ hoặc lệnh này, hãy yêu cầu trang trong một trình duyệt và tìm từ “noindex” trong nội dung phản hồi và tiêu đề phản hồi.
Bị công cụ xóa trang chặn: Trang hiện bị một yêu cầu xóa URL chặn. Nếu là chủ sở hữu trang web đã được xác minh, bạn có thể sử dụng công cụ xóa URL để xem ai đã gửi yêu cầu xóa URL. Yêu cầu xóa chỉ có hiệu lực trong khoảng 90 ngày tính từ ngày xóa. Sau thời gian đó, Googlebot có thể quay lại và lập chỉ mục trang, ngay cả khi bạn không gửi yêu cầu lập chỉ mục khác. Nếu bạn không muốn Google lập chỉ mục trang, hãy sử dụng lệnh ‘noindex’, yêu cầu ủy quyền đối với trang hoặc xóa trang.
Bị tệp robots.txt chặn: Trang này đã bị tệp robots.txt chặn khỏi Googlebot. Bạn có thể xác minh điều này bằng trình kiểm tra robots.txt. Xin lưu ý rằng điều này không có nghĩa là trang sẽ không được lập chỉ mục bằng một số phương thức khác. Nếu có thể tìm thấy thông tin khác về trang này mà không cần tải trang, Google vẫn có thể lập chỉ mục trang (mặc dù điều này ít gặp hơn). Để đảm bảo rằng Google không lập chỉ mục một trang, hãy xoá quy tắc chặn trong robots.txt và sử dụng lệnh ‘noindex’.
Bị chặn do yêu cầu trái phép (401): Trang đã bị chặn khỏi Googlebot do có yêu cầu ủy quyền (phản hồi 401). Nếu bạn muốn Googlebot có thể thu thập dữ liệu trang này, hãy xoá yêu cầu ủy quyền hoặc cho phép Googlebot truy cập vào trang của bạn.
Đã thu thập dữ liệu – hiện không được lập chỉ mục: Google đã thu thập dữ liệu nhưng chưa lập chỉ mục trang. Trang có thể được hoặc không được lập chỉ mục trong tương lai; bạn không cần phải gửi lại URL này để thu thập dữ liệu.
Đã phát hiện – hiện chưa được lập chỉ mục: Google đã phát hiện thấy trang nhưng chưa thu thập dữ liệu. Thông thường, Google muốn thu thập dữ liệu URL này nhưng quy trình này có thể sẽ làm quá tải trang web; do đó Google đã lên lịch thu thập lại dữ liệu. Đây là lý do ngày thu thập dữ liệu gần đây nhất được để trống trên báo cáo.
Trang thay thế có thẻ chuẩn thích hợp: Trang này trùng lặp với một trang mà Google công nhận là trang chuẩn. Trang này trỏ đến trang chuẩn thích hợp, do vậy bạn không cần phải làm gì.
Trang trùng lặp không có trang chuẩn do người dùng chọn: Trang này có các trang trùng lặp nhưng không trang nào trong số đó được đánh dấu là chuẩn. Chúng tôi nghĩ rằng trang này không phải là trang chuẩn. Bạn nên đánh dấu trang chuẩn cho trang này một cách rõ ràng. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.
Trang trùng lặp, Google chọn trang chuẩn khác với người dùng: Trang này được đánh dấu là trang chuẩn cho một tập hợp trang, nhưng Google nghĩ rằng một URL khác là phiên bản chuẩn thích hợp hơn. Google đã lập chỉ mục trang mà chúng tôi xem là trang chuẩn chứ không phải trang này. Chúng tôi khuyên bạn đánh dấu trang này là bản sao của URL chính tắc một cách rõ ràng. Google phát hiện thấy trang này mặc dù chưa có yêu cầu rõ ràng về việc thu thập dữ liệu. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.
Không tìm thấy (404): Trang này đã trả về lỗi 404 khi được yêu cầu. Google đã phát hiện thấy URL này mặc dù không có yêu cầu rõ ràng hay sơ đồ trang web nào. Google có thể đã phát hiện thấy URL dưới dạng đường liên kết từ một trang web khác hoặc có thể trang đã tồn tại trước đó và đã bị xóa. Googlebot có thể sẽ tiếp tục thử thu thập dữ liệu URL này trong một khoảng thời gian. Không có cách nào để yêu cầu Googlebot quên một URL vĩnh viễn, mặc dù Googlebot sẽ thu thập dữ liệu URL đó ít thường xuyên hơn. Phản hồi 404 không phải là vấn đề nếu đó là chủ đích của bạn. Nếu trang của bạn đã di chuyển, hãy sử dụng lệnh chuyển hướng 301 tới vị trí mới. Hãy đọc phần Sửa lỗi 404
Trang có lệnh chuyển hướng: URL là một đường liên kết chuyển hướng và do đó không được thêm vào chỉ mục.
404 mềm: Yêu cầu trang trả về lỗi mà chúng tôi nghĩ là phản hồi 404 mềm. Điều này có nghĩa là trang trả về thông báo “not found” (không tìm thấy) thân thiện với người dùng mà không kèm theo mã phản hồi 404 tương ứng. Bạn nên trả về mã phản hồi 404 cho các trang “not found” (không tìm thấy) thực sự hoặc thêm thông tin khác vào trang để cho chúng tôi biết rằng đó không phải là mã 404 mềm. Tìm hiểu thêm
URL đã gửi không được chọn là trang chuẩn: URL thuộc một tập hợp các URL trùng lặp mà trong đó không có trang chuẩn được đánh dấu rõ ràng. Bạn đã yêu cầu URL này được lập chỉ mục một cách rõ ràng, nhưng vì URL là trang trùng lặp và Google nghĩ rằng một URL khác là trang chuẩn thích hợp hơn, Google đã không lập chỉ mục URL này. Thay vào đó, chúng tôi đã lập chỉ mục trang chuẩn mà chúng tôi chọn. (Google chỉ lập chỉ mục trang chuẩn trong một nhóm các trang trùng lặp.) Sự khác nhau giữa trạng thái này và “Google chọn trang chuẩn khác với người dùng” là bạn đã yêu cầu lập chỉ mục một cách rõ ràng trong trường hợp này. Bạn sẽ thấy URL chính tắc do Google chọn khi kiểm tra URL này.
Bị chặn do lỗi truy cập bị cấm (403): Tác nhân người dùng đã cung cấp thông tin đăng nhập nhưng vẫn không được cấp quyền truy cập. Tuy nhiên, Googlebot không bao giờ cung cấp thông tin đăng nhập, vì vậy, máy chủ của bạn trả lại lỗi này là do nhầm lẫn. Bạn phải khắc phục lỗi này hoặc chặn trang bằng tệp robots.txt hoặc lệnh noindex.
Bị chặn do lỗi 4xx khác: Máy chủ gặp một lỗi 4xx không thuộc bất kỳ loại vấn đề nào khác đã nêu ở đây.
Thông tin này có hữu ích không?
Chúng tôi có thể cải thiện trang này bằng cách nào?
[external_footer]