Czy błędy 404 szkodzą mojej witrynie?

Poniedziałek, 2 maja 2011 r.

Masz witrynę firmową i uruchamiasz Narzędzia dla webmasterów, żeby zobaczyć, jak świetnie ona działa... Ale zaraz! Strona Błędy indeksowania jest pełna błędów 404 (Not found)! Czy zbliża się katastrofa?

Funkcja Błędy indeksowania w Narzędziach dla webmasterów

Nie martw się, młody padawanie. Przyjrzyjmy się 404 błędom i sprawdźmy, jak wpływają (lub nie) na Twoją witrynę:

P: Czy błędy 404 zgłaszane w Narzędziach dla webmasterów wpływają na pozycję witryny w rankingu?
O: Błędy 404 to zupełnie normalne elementy w internecie. Internet zawsze się zmienia, powstają nowe treści, stare treści znikają i najlepiej, gdy po usunięciu treści strona zwraca kod odpowiedzi HTTP 404. Wyszukiwarki o tym wiedzą. Jak widać powyżej, w naszych własnych witrynach wykryliśmy błędy 404. Takie błędy można znaleźć wszędzie w internecie. Tak naprawdę to wolimy, aby po usunięciu strony z witryny zwracała ona prawidłowy kod odpowiedzi 404 lub 410 (zamiast soft 404). Pamiętaj, że aby nasz robot mógł zobaczyć kod odpowiedzi HTTP w danym adresie URL, musi mieć możliwość indeksowania tego adresu URL. Jeśli URL jest zablokowany w pliku robots.txt, nie możemy go zindeksować ani odczytać jego kodu odpowiedzi. To, że niektóre adresy URL w Twojej witrynie już nie istnieją lub zwracają błędy 404, nie wpływa na ranking pozostałych adresów URL witryny (czyli tych, które zwracają kody stanu 200 (Success)) w wynikach wyszukiwania.

P: Czy więc błędy 404 w ogóle nie zaszkodzą mojej witrynie?
O: Jeśli niektóre adresy URL w Twojej witrynie zwracają błąd 404, nie szkodzi to jej w żaden sposób ani nie obniża jej pozycji w wynikach wyszukiwania Google. Mogą jednak istnieć inne powody, dla których warto usunąć określone typy błędów 404. Jeśli na przykład niektóre strony z błędem 404 są ważne, które są dla Ciebie istotne, zastanów się, dlaczego widzimy błędy typu 404 podczas ich indeksowania. Jeśli widzisz błąd w pisowni prawidłowego adresu URL (np. www.example.com/supr zamiast www.example.com/super), prawdopodobnie ktoś chciał umieścić link do Twojej witryny i po prostu się pomylił. Zamiast zwracać kod 404 możesz użyć przekierowania 301 nieprawidłowego adresu URL do prawidłowego adresu URL i w ten sposób przechwycić zamierzony ruch z tego linku. Możesz też zadbać o to, aby użytkownicy trafiający na stronę 404 w Twojej witrynie mogli łatwiej znaleźć to, czego szukali, a nie tylko komunikat „Błąd 404 – Nie znaleziono”.

P: Chcę dowiedzieć się więcej o błędzie „soft 404
O: Błąd soft 404 oznacza, że w przypadku adresu URL, który nie istnieje, serwer WWW zwraca kod odpowiedzi inny niż 404 (lub 410). Typowy przykład to sytuacja, gdy właściciel witryny chce zwrócić ładną stronę 404 z przydatnymi informacjami dla użytkowników i uważa, że aby wyświetlać treści użytkownikom, musi zwracać kod odpowiedzi 200. To nie tak. Możesz zwrócić kod odpowiedzi 404 podczas wyświetlania dowolnych treści. Inny przykład to przekierowanie wszystkich nieznanych adresów URL do strony głównej witryny zamiast zwracania błędów 404. W obu przypadkach może to mieć negatywny wpływ na interpretację i indeksowanie witryny, zalecamy więc, żeby serwer zwracał prawidłowe kody odpowiedzi nieistniejącej treści. Pamiętaj, że sam fakt, że stronawyświetla komunikat404 Nie znaleziono”, nie oznacza, że zwraca ona kod odpowiedzi HTTP 404 – użyj funkcji Pobierz jako Googlebot w Narzędziach dla webmasterów, aby to sprawdzić. Jeśli nie wiesz, jak skonfigurować serwer w celu zwracania właściwych kodów odpowiedzi, zapoznaj się z dokumentacją pomocy dostawcy hostingu witryn.

P: Skąd mam wiedzieć, czy URL powinien mieć wartość 404, 301 czy 410?
O: Gdy usuwasz stronę z witryny, wybierz sposób postępowania w zależności od tego, czy ta treść jest przenoszona gdzie indziej, czy też nie planujesz już jej udostępniać w witrynie. Jeśli przenosisz ją pod nowy adres URL, użyj przekierowania 301 ze starego adresu URL na nowy. Dzięki temu, gdy użytkownicy skorzystają ze starego adresu URL, zostaną automatycznie przekierowani do czegoś, czego szukają. Gdy usuwasz tę treść i nie masz w witrynie niczego podobnego, wtedy stary URL powinien zwracać błąd 404 lub 410. Obecnie Google traktuje 410 (Gone) tak samo jak 404 (Not found), więc nie ma dla nas znaczenia, który z nich witryna będzie zwracać.

P: Większość błędów 404 dotyczy dziwnych adresów URL, których w mojej witrynie nigdy nie było. O co chodzi? Skąd się wzięły?
O: Jeśli Google znajdzie w internecie link wskazujący adres URL w Twojej domenie, może spróbować go zindeksować, niezależnie od tego, czy pod tym adresem istnieje jakakolwiek treść. W takim przypadku serwer powinien zwrócić wartość 404, jeśli nie ma niczego do znalezienia. Przyczyną występowania tych linków może być literówka w tekście linku do Twojej witryny, błędy w konfiguracji (jeśli linki są generowane automatycznie, np. przez system CMS) lub utrudnienia w przetwarzaniu danych przez Google w celu rozpoznania i zindeksowania linków umieszczonych w kodzie JavaScript lub innej umieszczonej treści. Takie linki mogą też być częścią szybkich testów z naszej strony, za pomocą których sprawdzamy, jak serwer obsługuje nieznane adresy URL. Możliwe są też inne przyczyny. Jeśli w Narzędziach dla webmasterów pojawią się błędy 404 dotyczące adresów URL, które nie istnieją w Twojej witrynie, możesz je bezpiecznie zignorować. Nie wiemy, które adresy URL są dla Ciebie ważne, a które powinny mieć stan 404. Dlatego wyświetlamy wszystkie błędy 404, które znaleźliśmy w Twojej witrynie, i pozwalamy Ci zdecydować, które z nich wymagają Twojej uwagi.

P: Ktoś skopiował moją witrynę i spowodował szereg błędów 404. Są to „prawdziwe” adresy URL z innym kodem, takim jak https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>. Czy spowoduje to szkody w mojej witrynie?
O: Ogólnie nie musisz się martwić, że „uszkodzone linki” tego typu będą szkodliwe dla Twojej witryny. Zdajemy sobie sprawę, że właściciele zazwyczaj witryn nie mają żadnej kontroli nad osobami, które powielają treści z ich witryny lub udostępniają linki do niej w nieoczekiwany sposób. Jeśli znasz się na wyrażeniach regularnych, możesz przekierowywać te adresy URL, ale ogólnie nie warto się tym przejmować. Pamiętaj, że możesz też przesłać żądanie usunięcia treści, jeśli uważasz, że ktoś kradnie oryginalne treści z Twojej witryny.

P: W zeszłym tygodniu naprawiliśmy wszystkie błędy 404 zgłoszone przez Narzędzia dla webmasterów, ale nadal są one widoczne na moim koncie. Czy to oznacza, że nie zostały one poprawnie naprawione? Kiedy znikną?
O: Spójrz na kolumnę „Wykryto” na stronie Błędy indeksowania – to ostatnia data, w której wykryliśmy poszczególne błędy. Jeśli daty w tej kolumnie pochodzą sprzed daty naprawienia błędów, oznacza to, że od tego dnia nie natrafiliśmy na te błędy. Jeśli daty są nowsze, błędy 404 nadal są widoczne podczas indeksowania.

Po zaimplementowaniu poprawki możesz sprawdzić, czy nasz robot widzi nowy kod odpowiedzi. Aby to zrobić, skorzystaj z narzędzia Pobierz jako Googlebot. Przetestuj kilka adresów URL. Jeśli wyglądają prawidłowo, błędy powinny wkrótce zacząć znikać z listy błędów indeksowania.

P: Czy mogę użyć narzędzia Google do usuwania adresów URL, aby błędy 404 zniknęły z mojego konta szybciej?
O: Nie. Narzędzie do usuwania adresów URL usuwa adresy URL z wyników wyszukiwania Google, a nie z konta w Narzędziach dla webmasterów. To narzędzie służy tylko do pilnych żądań usunięcia i nie trzeba go używać, gdy adres URL zwraca już wartość 404, ponieważ taki adres URL z czasem naturalnie zniknie z wyników wyszukiwania. W dolnej części tego posta na blogu znajdziesz szczegółowe informacje o czynnościach obsługiwanych i nieobsługiwanych przez narzędzie do usuwania adresów URL.

Chcesz dowiedzieć się jeszcze więcej o błędach 404? Przeczytaj Tydzień z błędem 404 na naszym blogu lub odwiedź nasze Forum pomocy dla webmasterów.