Cách xóa URL khỏi kết quả tìm kiếm Google – MOMD Academy

Thực tế hầu hết anh em SEOer chỉ tập trung làm sao để đạt được thứ hạng cao hơn trên Google. Tuy nhiên, một số trường hợp cần thiết bạn phải xóa URL khỏi hệ thống kể trên.

Điển hình nhất phải kể đến các bài viết đã cũ hoặc bị trùng lặp. Nếu bạn để nguyên những đường dẫn này thì quá trình lập chỉ mục cho web sẽ trở nên khó khăn. Chưa kể tới, trang web còn có thể bị tụt hạng và nằm trong “danh sách đen” của Google nữa đấy! 

Giới thiệu

Việc xóa URL khỏi kết quả tìm kiếm google cũng quan trọng không kém với việc tối ưu để thăng hạng cho website của bạn. Nó cực kỳ cần thiết trong các trường hợp như:

  • Nội dung bài viết đã cũ.
  • Các bài viết có nội dung trùng lặp.
  • Các link “bẩn” bị đối thủ chơi xấu.
  • Nội dung nhạy cảm, bị cấm dễ khiến trang web bị gắn cờ.
  • Các đường dẫn mà bạn muốn che đi, không cho Google biết nhưng đã bị hệ thống lập chỉ mục tự động.

Vì lẽ đó, MOMD Group sẽ mách nước giúp bạn biết cách xóa URL trong từng trường hợp. Bằng các giải mã chi tiết, tin rằng việc bỏ thời gian cho chia sẻ này sẽ không lãng phí chút nào đâu! 

Cách xóa URL có nội dung bị trùng lặp hoặc không còn phù hợp

Các nội dung không còn giá trị với người dùng vẫn ảnh hưởng tới thang điểm SEO do bot Google đánh giá. Những bài viết dạng này khiến công cụ tìm kiếm bị “nhầm lẫn”. Nó gặp khó khăn vì không biết nên lập chỉ mục và xếp hạng website của bạn như thế nào mới hợp lý.

Xác định URL nào cần show ra để người dùng nhìn thấy

Dễ nhận thấy, các website bán sản phẩm thường có nhiều bài viết na ná giống nhau. Nếu bạn để tự nhiên, Google sẽ bối rối vì phát hiện ra các nội dung trùng lặp. Do đó, bạn cần báo cáo với hệ thống để nó biết đâu là đường dẫn cần lập chỉ mục và đâu là URL nên bỏ qua.

Bạn có thể xác định bằng những tiêu chí sau đây:

URL có giá trị

URL không có giá trị

  • Đường dẫn có nhiều lượt truy cập tự nhiên (không phải trả tiền). Nói cách khác, đường dẫn có dạng Friendly URL sẽ thân thiện với người dùng hơn.
  • URL được tiếp cận từ các trang web khác, tức được trang khác giới thiệu, dẫn link tới.
  • URL không nhận được những truy cập tự nhiên.
  • Không được nhắc tới trong các trang web khác, không được dẫn link về.
  • Với dạng này, bạn hãy dùng lệnh noindex để bot Google bỏ qua, không lập chỉ mục đường dẫn đó.

Điều này đã được không ít “cao thủ” SEO chứng thực. Chia sẻ của bà InFaye Watt hiện là Giám đốc SEO của công ty Seeker Digital cho rằng:

Những nội dung ít giá trị, không đầy đủ, sơ sài hoặc  trùng lặp mang đến các tác động tiêu cực cho quá trình thăng hạng của trang web. 

Khi bạn có những bài viết như vậy, chúng ta không nhất thiết phải xóa các URL này. Tuy nhiên, bạn có thể thay đổi, bổ sung thêm để có nội dung phù hợp.

Mặt khác, tôi đã xóa các URL không cần thiết và thấy lượng truy cập Organic trên trang đã tăng 23% so với trước đó”.

Trong khi ấy, Giám Marketing online của Inchoo, cô Andreja Čičak cũng chia sẻ rằng:

“Nếu muốn tránh các vấn đề về trùng lặp nội dung, SEOer cần xây dựng một chiến lược bài bản, vững chắc. Và bạn cũng nên sẵn sàng cho sự thay đổi khi cần.

Chẳng hạn, nếu danh muc có các sản phẩm tương tự nhau, việc để lập chỉ mục sẽ không khoa học và ảnh hưởng tới thứ hạng. Vì vậy, bạn chỉ nên giới thiệu bài viết đầy đủ nhất hay gọi là sản phẩm”mẹ”- chứa đầy đủ các sản phẩm con cụ thể hơn.

Các nội dung khác nên tránh để bot Google lập chỉ mục sẽ tốt hơn cả.

Xử lý các URL lỗi thời, trùng lặp thế nào mới chuẩn?

Khi có các đường dẫn chứa nội dung trùng lặp, không còn quan trọng và phù hợp, bạn nên xử lý theo những hướng sau để tăng trải nghiệm cũng như có được điểm cộng trong mắt Google:

Trường hợp URL đã có lượng truy cập nhất định và có liên kết qua lại

  • Bạn chuyển hướng 301 đến URL có nội dung liên quan hơn cả trên trang web của mình.
  • Tránh chuyển hướng đến các đường dẫn không hợp lý. Bởi cách này có thể khiến Google coi đây là lỗi Soft-404 .
  • Điều kể trên khiến hệ thống không tính bất cứ điểm nào cho mục tiêu chuyển hướng vừa rồi. 

Trường hợp URL không có bất cứ lượt nhấp và liên kết nào

  • Bạn hãy dùng mã HTTP 410 status code  để web biết rằng các URL đã bị xóa vĩnh viễn.
  • Khi thấy mã 410, hệ thống sẽ nhanh chóng xóa các URL này ra khỏi chỉ mục.

Ông Andy Chadwick, chuyên viên tư vấn SEO cao cấp của Digital Quokka cho hay. Sau khi chuyển hướng, bạn vẫn nên gửi sơ đồ trang web cả cũ và mới của mình vào Google Search Console. 

Thông thường thời gian cập nhật sẽ kéo dài khoảng 3-4 tháng. Và những URL chuyển hướng sẽ bắt đầu được công cụ tìm kiếm biết tới.

Cách xóa các URL đã lưu trong bộ nhớ cache bằng Google Search Console

Google thường giữ một bản sao lưu trong bộ nhớ cache của các trang web bạn đang quản lý. Nếu bạn muốn xóa các nội dung này hỏi bộ nhớ cache, hãy dùng tính năng “Clear Cache URL” hay được dịch ra là  “Xóa URL trong bộ nhớ cache” tại Google Search Console.

Bạn thực hiện các bước sau đây để có thể hoàn tất thao tác kể trên:

  1. Bạn đăng nhập vào tài khoản Google Search Console.
  2. Chọn website mà bạn đang quan tâm.
  3. Nhấp vào Removals nằm ngay trong menu cột ở phía bên phải. xóa url khỏi kết quả tìm kiếm
  4. Bấm vào NEW REQUEST.
  5. Sau đó bạn chuyển sang tab CLEAR CACHED URL. xóa url khỏi kết quả tìm kiếm
  6. Bạn thực hiện xóa các URL đã lưu trong bộ nhớ cache bằng cách điền URL vào thanh tìm kiếm sau đó nhấn Next để hoàn tất.

Lưu ý:

Ở một số trường hợp, Google sẽ không giữ lại các bản sao như thường lệ. Bởi có thể trang của bạn đã sử dụng lệnh không lưu trữ (noarchive meta robots tag.)

Xin lưu ý rằng bạn có thể hướng dẫn Google không giữ các bản sao được lưu trong bộ nhớ cache của các trang của bạn bằng cách sử dụng thẻ meta robots không lưu trữ.

Google Search Console là một công cụ tổng hợp các dữ liệu khái quát về từ khóa, lưu lượng truy cập, hành vi người dùng,…Trước khi thực hiện phương pháp Google Remove URL này, hãy tìm hiểu qua cách sử dụng và đọc thông số trên công này nhé. Tất cả kiến thức đều được chia sẻ ngay trong khóa học đào tạo SEO tại MOMD Group bạn nhé!

Cách xóa URL “nháp”

Mình gọi các URL và những bài viết sơ khai ban đầu được đẩy lên web là “URL nháp”. Ý muốn nói, ở giai đoạn này, đôi khi chúng ta cần có nhiều bài viết để “làm đầy” giao diện để tránh cảm thấy sơ sài, nghèo nàn về nội dung.

Do thiếu thời gian, tiến độ quá gấp hoặc vì một số lý do nào đó, các bài viết bạn đẩy lên web chưa thật sự ổn. Và bây giờ sau khi hệ thống đã “ổn” hơn một chút, chúng ta cần “dọn dẹp” để tránh các nội dung chưa chất lượng làm loãng kiến thức giá trị trên website.

Để làm được việc này, bạn thực hiện những thao tác sau:

Trường hợp các URL này có thứ hạng rất tệ

Khi URL có lượng truy cập thấp, không mang tới thông tin giá trị, bạn hãy xóa đường dẫn này bằng cách:

  1. Đầu tiên, bạn đăng nhập vào tài khoản Google Search Console của bạn.
  2. Bạn chọn thuộc tính dàn (hoặc xác minh nếu bạn chưa có).
  3. Nhấp vào Removals trong menu ở ngay cột phía bên phải. xóa url khỏi kết quả tìm kiếm
  4. Bạn nhấp vào NEW REQUEST để chuyển sang tab TEMPORARILY REMOVE URL. xóa url khỏi kết quả tìm kiếm
  5. Bạn tiếp tục chọn Remove all URLs with this prefix, sau đó bạn nhập URL vào ô và nhấn Next. 

Lưu ý, Google sẽ lưu các URL ẩn trong 180 ngày. Đồng thời, nó vẫn nằm trong chỉ mục của Google. Do đó, bạn cần xóa các đường dẫn này để quá trình SEO có kết quả khả quan hơn.

  1. Để xóa các bản sao nội dung đã lưu trong bộ nhớ cache của Google, bạn hãy Xóa các URL được lưu trong bộ nhớ cache đã được hướng dẫn ở phần trên.
  2. Bạn hãy sử dụng lệnh noindex với mã nguồn HTML hoặc X-Robots-Tag với mã HTTP để ẩn các link này, ngăn lập chỉ mục nhanh chóng.
  3. Tiếp theo, bạn tạo sơ đồ trang XML với các URL không được lập chỉ mục. Mục đích  để Google có thể dễ dàng nhận diện và bỏ qua lập chỉ mục các đường dẫn kể trên.
  4. Sau khi đã chắc chắn Google không lập chỉ mục như bạn muốn, lúc này bạn có thể xóa sơ đồ trang web XML và thêm xác thực HTTP. Nhờ thế, website  được bảo vệ tốt hơn và các nội dung muốn che đi, xóa đi sẽ không xuất hiện nữa.

Trường hợp URL có thứ hạng cao hơn so với URL bạn muốn tăng thứ hạng

Khi URL nháp của bạn có lượng truy cập cao, thứ hạng tốt, bạn đừng xóa nó. Thay vào đó, chúng ta sẽ điều hướng nó về bài viết bán hàng mà mình đang muốn SEO. Bạn có thể hiện thực hóa thao tác này bằng các bước sau:

  1. Bạn thực hiện tương tự từ bước 1-6 như phần chia sẻ kể trên.
  2. Tiếp theo, bạn chuyển hướng 301 từ URL nháp kể trên đến URL chính mà bạn đang muốn kéo thứ hạng.
  3. Bạn bắt đầu thiết lập một môi trường dàn dựng mới trên một miền (phụ) khác với miền đã được lập chỉ mục. Đồng thời, bạn hãy đảm bảo áp dụng xác thực HTTP cho nó. Mục đích giúp chúng ta ngăn nó được lập chỉ mục lại.

Những điều cần tránh khi xử lý các URL nháp được lập chỉ mục

Mình có một số lời khuyên sau dành cho bạn. Nếu muốn xóa URL nháp khỏi web, bạn đừng sử dụng lệnh Disallow: /tệp robots.txt. Bởi điều này ngay web truy cập vào các URL khác và nó khiến các link khác trên web của bạn bị che đi ở dạng như dưới đây:

xóa url khỏi kết quả tìm kiếm

Tomas Ignatavicius- một Chuyên gia tư vấn SEO có tiếng cho biết. Bạn nên cẩn trọng để tránh gây ra các xáo trộn đáng tiếc lên web. Những điều này thường liên quan tới:

  • Tệp Robots.txt.
  • Các tệp cấu hình máy chủ web như .htaccess, nginx.confhoặc web.config.
  • Các tệp bạn sử dụng cho quá trình triển khai thẻ meta (mục đích để bảo vệ hệ thống của bạn khỏi bị lập chỉ mục và trang web đang hoạt động khỏi bị hủy lập chỉ mục).
  • Các tệp JS liên quan đến nội dung và hiển thị DOM.

Thực tế, khách hàng của Tomas đã gặp hiện tượng trang web bị ảnh hưởng vì tác động của  tệp robots.txt và lệnh Disallow:  /cũng như hoặc ngược lại

Cách xóa các URL spam

Tình trạng website bị tấn công, chứa nhiều URL spam vô cùng phổ biến. Bạn nên theo dõi thường xuyên và nhanh chóng xóa những đường dẫn này khỏi trang web của mình. Bởi càng để lâu thì nó càng gây “tổn thương” đến hệ thống và khiến Google đánh giá thấp về website.

Để thực hiện được công việc này, bạn làm các thao tác tuần tự như sau:

Bước 1: Sử dụng Công cụ xóa của Google Search Console

Công cụ xóa của Google Search Console giúp chúng ta sớm loại bỏ các đường dẫn spam. Nhưng bạn nên nhớ rõ rằng, nó chỉ giúp chúng ta tạm thời ẩn chúng đi để tránh bị lập chỉ mục chứ không khử chỉ mục của trang.

Bạn thực hiện như sau:

  1. Bạn đăng nhập vào tài khoản Google Search Console.
  2. Bạn chọn website muốn xóa các URL spam.
  3. Bạn nhấn vào  Removal nằm tại menu cột phía bên phải.xóa url khỏi kết quả tìm kiếm
  4. Bạn nhấp vào NEW REQUEST để chuyển sang tab TEMPORARILY REMOVE URL.xóa url khỏi kết quả tìm kiếm
  5. Bạn chọn Remove this URL only, sau đó nhập URL bạn muốn xóa và nhấn Next. Cũng tương tự như phần kể trên, Google sẽ giữ URL ẩn trong 180 ngày. Nó sẽ vẫn nằm trong chỉ mục của Google. Do đó, bạn cần ẩn chúng đi để an toàn hơn.
  6. Trong trường hợp bạn có một lượng lớn các URL spam, hãy dùng lệnh Remove all URLs with this prefix. Tuy nhiên, mình khuyên bạn nên cẩn trọng với thao tác này. Bởi nó có thể ẩn đi hàng nghìn URL khớp với tiền tố mà bạn đã nhập vào trường Enter URL.
  7. Đồng thời, bạn cũng đừng quên xóa các bản sao được lưu trong bộ nhớ cache của Google. Những URL spam này sẽ biến mất khi bạn thực hiện các xóa cách URL được lưu trong bộ nhớ cache đã được chia sẻ kể trên.

Bước 2: Xóa các URL spam và chuyển hướng chương trình

Ở bước này, bạn hãy khôi phục trạng thái trang web trước đó bằng cách khôi phục các bản sao lưu. Vạn có thể chạy các bản cập nhập rồi thêm bảo mật nhằm giúp trang web không bị tấn công nữa.

Bước kiểm tra xem URL spam đã biến mất khỏi web chứa rất quan trọng. Vì thế, dù vội mấy đi nữa bạn cũng nên thực hiện thao tác này.

Tốt hơn hết, bạn nên dùng mã HTTP 410 để đảm bảo những URL spam đã biến mất hoàn toàn.

Bước 3: Tạo một sơ đồ trang XML bổ sung

Bạn hãy tạo một sơ đồ trang XML là hệ thống những URL spam, sau đó hãy gửi đến Google Search Console. Bằng cách này, Google có thể nhanh chóng “ăn sạch” các URL spam và bạn có thể dễ dàng theo dõi quá trình xóa thông qua Google Search Console.

Cách xóa URL có nội dung nhạy cảm 

Một số đường dẫn có nội dung nhạy cảm, không nên công khai như:

  • Thông tin cá nhân của khách hàng.
  • Sơ yếu lý lịch của nhân viên.
  • Số nhà, số điện thoại, địa chỉ email.
  • ….

Lúc này, bạn cần xóa các đường dẫn này bằng cách sau:

Bước 1: Sử dụng Công cụ xóa URL của Google Search Console

Nhờ Google Search Console để ẩn các đường dẫn có nội dung nhạy cảm vẫn được xem là phương pháp nhanh chóng nhất. Nhưng cũng như đã đề cập ở trên, cách này chỉ giúp bạn tạm ẩn khỏi chỉ mục chứ không xóa các URL này.

Bạn thực hiện các bước sau để hoàn tất cách làm kể trên:

  1. Bạn đăng nhập vào tài khoản Google Search Console.
  2. Bạn chọn website muốn xóa các URL spam.
  3. Bạn nhấn vào  Removal nằm tại menu cột phía bên phải.xóa url khỏi kết quả tìm kiếm
  4. Bạn nhấp vào NEW REQUEST để chuyển sang tab TEMPORARILY REMOVE URL.xóa url khỏi kết quả tìm kiếm
  5. Bạn chọn Remove this URL only, sau đó nhập URL bạn muốn xóa và nhấn Next. Cũng tương tự như phần kể trên, Google sẽ giữ URL ẩn trong 180 ngày. Nó sẽ vẫn nằm trong chỉ mục của Google. Do đó, bạn cần ẩn chúng đi để an toàn hơn.
  6. Trong trường hợp bạn có một lượng lớn các URL spam, hãy dùng lệnh Remove all URLs with this prefix. Tuy nhiên, mình khuyên bạn nên cẩn trọng với thao tác này. Bởi nó có thể ẩn đi hàng nghìn URL khớp với tiền tố mà bạn đã nhập vào trường Enter URL.
  7. Đồng thời, bạn cũng đừng quên xóa các bản sao được lưu trong bộ nhớ cache của Google. Những URL spam này sẽ biến mất khi bạn thực hiện các xóa cách URL được lưu trong bộ nhớ cache đã được chia sẻ kể trên.

Bước 2: Xóa nội dung và phân phát chương trình  và tạo một sơ đồ trang XML bổ sung

Bạn làm tương tự như bước 2 và 3 phần chia sẻ phía trên.

Bước 4: Ngăn rò rỉ dữ liệu nhạy cảm 

Bạn cũng đừng quên thực hiện các thao tác bảo mật và tăng cấp cho thao tác này. Nhờ thế, những nội dung riêng tư sẽ không bị rò rỉ và gây ảnh hưởng xấu tới hệ thống của chúng ta.

Cách xóa nội dung bị “đánh cắp”

Chuyện “ăn cắp chất xám”, copy bài viết của người khác và quăng lên web mình, sau đó nhận được thứ hạng cao hơn cả người viết không hề hiếm.

Để xử lý cách chơi “không đẹp” này, bạn có thể thực hiện theo một số phương pháp sau:

Liên hệ với chủ trang web

Đầu tiên, bạn nên thẳng thắn liên hệ và nói chuyện trực tiếp với đại diện của website lấy bài của mình. Thực tế, một số đơn vị hiện nay thuê content hoặc nhân viên viết bài. Những đối tượng này đã tự ý lấy sản phẩm của người khác rồi đăng tải lên, nó hoàn toàn không phải chủ ý của người đứng đầu.

Nếu gặp trường hợp này, bạn chỉ cần yêu cầu họ chuyển hướng 301 đến URL của bạn hoặc xóa bài trên trang là xong.

Nếu chủ sở hữu từ chối hợp tác thì sao?

Bạn nên nhờ Google can thiệp nếu như cách thứ nhất không khả thi. Lúc này, hệ thống sẽ giúp bạn:

Cách xóa hình ảnh khỏi trang tìm kiếm Google 

Tuy không nên lạm dụng tệp robots.txt, nhưng đối với những hình ảnh bạn muốn xóa khỏi lập chỉ mục của Google thì đây vẫn là phương án khả thi hơn cả.

Bạn có thể xem thêm về các hướng dẫn mà Google gợi ý về phần này ở mục công cụ xóa của hệ thống.

 Bạn sẽ thấy, chia sẻ có đề cập tới các tệp HTML và không phải HTML cũng như tác động của dòng Do not use robots.txt as a blocking mechanism.:

xóa url khỏi kết quả tìm kiếm

Hoặc bạn cũng có thể xem thêm hướng dẫn về  “Ngăn hình ảnh trên trang của bạn xuất hiện trong kết quả tìm kiếm”. Đoạn dưới đây đã đề cập đến khá chi tiết:

xóa url khỏi kết quả tìm kiếm

Cách xóa hình ảnh khỏi lập chỉ mục của Google:

  1. Bạn thực hiện tương tự các bước từ 1-6 ở phần trên như cách ẩn URL.
  2. Sau đó, bạn thêm dòng này vào tệp robots.txt:

 User-agent: Googlebot-Image

 Disallow: /images/secret/

Nhờ thế, ở lần cập nhật mới, bot Google sẽ không còn thấy hình ảnh mà bạn muốn xóa và nó cũng không còn ở phần chỉ mục trên web của bạn nữa.

InVicky Mills, Giám đốc SEO cao cấp của Blue Array cho biết, khác với URL, chúng ta không có các thẻ meta để ngăn lập chỉ mục cho hình ảnh. Tuy nhiên, bạn có thể dùng X-Robots để chỉ định ngăn lập chỉ mục.

Nhưng tuyệt vời nhất vẫn là dùng công cụ Xóa hoặc chặn URL hình ảnh bạn muốn bằng robots.txt. sẽ tốt hơn cả.

Kết luận

Bạn nên nhớ rằng không có cách nào đơn giản và có thể áp dụng cho tất cả các trường hợp muốn ẩn URL đi. Mỗi tình huống có những đặc điểm rất khác biệt. Vì lẽ đó, khi SEO website, bạn nên linh động và luôn luôn cập nhật xu hướng mới.

Đừng quên đón xem bài tiếp theo để biết thế nào là một URL thân thiện với SEO bạn nhé! 

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *