Nasza walka ze spamem w wyszukiwarce w 2020 roku

Czwartek, 29 kwietnia 2021 roku

Googlebot i jego znajomy robot czytają raport na temat spamu internetowego w 2020 roku

Wyszukiwarka Google to zaawansowane narzędzie, które ułatwia znajdowanie przydatnych informacji w otwartym internecie. Niestety, nie wszyscy twórcy stron internetowych mają dobre intencje. Wielu z nich specjalnie tworzy strony wprowadzające użytkowników w błąd, a my walczymy z tym procederem każdego dnia. Aby zapewnić Ci wygodę wyszukiwania, a także ochronę przed szkodliwymi treściami i działaniami, w 2020 roku wprowadziliśmy w wyszukiwarce Google wiele innowacji.

Skuteczniejsza walka ze spamem

Chociaż od początku istnienia naszej wyszukiwarki walczymy ze spamem, najnowsze postępy w dziedzinie sztucznej inteligencji pozwoliły nam osiągnąć niebywały przełom.

Dzięki połączeniu tej technologii i naszej szczegółowej wiedzy na temat spamu w ubiegłym roku udało nam się opracować własny system AI do walki ze spamem, który niezwykle skutecznie wykrywa znane i nowe zagrożenia tego rodzaju. Na przykład w porównaniu do stanu sprzed kilku lat ograniczyliśmy liczbę stron z automatycznie generowanymi i powielanymi treściami o ponad 80%.

W 2020 roku treści spamerskie umieszczane przez hakerów były nadal często widoczne, ponieważ liczba zagrożonych witryn pozostawała dość duża, ale zwiększyliśmy nasze możliwości wykrywania o ponad 50% i większość takiego spamu usunęliśmy z wyników wyszukiwania.

Tego problemu nie możemy rozwiązać samodzielnie. Nawet jeśli będziemy wykrywać cały spam i chronić przed nim użytkowników, hakerzy nadal będą wykorzystywali luki w zabezpieczeniach, dopóki nie zostaną one usunięte. Właściciele witryn mogą zadbać o bezpieczeństwo, przestrzegając zasad skutecznej ochrony, bo łatwiej jest zapobiegać atakom hakerów niż usuwać ich skutki. Google udostępnia zasoby, które pomagają poznać najczęstsze sposoby przeprowadzania ataków na witryny i dowiedzieć się, jak używać Search Console do sprawdzania, czy witryna została zaatakowana przez hakerów. Zapoznaj się z nimi, abyśmy mogli wspólnie chronić internet.

W ubiegłym roku miały miejsce ważne wydarzenia, w tym wybuch globalnej pandemii. Dlatego znaczną część wysiłków poświęciliśmy na ochronę miliardów wyszukiwań związanych z tymi zagadnieniami. Ktoś, kto szuka miejsca wykonywania testów na COVID-19, nie powinien natrafiać na bezsensowne strony ze spamem, które mogą przekierowywać do witryn wyłudzających informacje. Oprócz walki z treściami spamerskimi nawiązaliśmy współpracę z innymi zespołami zajmującymi się wyszukiwarką, aby zapewnić użytkownikom dostęp do najbardziej aktualnych, najlepszych informacji w odpowiednim miejscu i czasie.

Zapobieganie pojawianiu się spamu u użytkowników

Zanim Google wyświetli zestaw wyników wyszukiwania, w tle dzieje się wiele rzeczy. Codziennie odkrywamy, skanujemy i indeksujemy miliardy stron internetowych. Wśród nich znajduje się mnóstwo spamu – każdego dnia znajdujemy 40 miliardów stron, które go zawierają. Dowiedz się, jak staramy się wyeliminować ten spam z wyników wyszukiwania, aby zapewnić dostęp do przydatnych informacji.

Jak zapewniamy ochronę przed spamem na każdym etapie
Ten schemat przedstawia sposób ochrony przed spamem.

Przede wszystkim nasze systemy wykrywają spam podczas indeksowania stron i innych treści. Skanujemy treści, gdy nasze automatyczne systemy odwiedzają strony i decydują o ich uwzględnieniu w indeksie używanym do dostarczania wyników wyszukiwania. Niektóre treści uznane za spam nie są dodawane do indeksu.

Te systemy działają też w przypadku treści wykrywanych za pomocą witryn i Search Console. Na przykład w Search Console jest dostępna funkcja Poproś o zindeksowanie pozwalająca twórcom informować nas o nowych stronach, które powinny zostać szybko dodane. Zauważyliśmy, że spamerzy atakują niezabezpieczone witryny, podszywając się pod ich właścicieli, weryfikując się w Search Console i używając tego narzędzia do przesyłania do Google próśb o zindeksowanie wielu utworzonych przez nich stron ze spamem. Sztuczna inteligencja umożliwiła nam identyfikowanie podejrzanych przypadków weryfikacji i zapobieganie dodawaniu adresów URL ze spamem do naszego indeksu.

Korzystamy też z systemów, które analizują treści uwzględnione w naszym indeksie. Gdy użytkownik przeprowadza wyszukiwanie, systemy te sprawdzają, czy treści pasujące do wyszukiwanego hasła nie zawierają spamu. W przypadku wykrycia spamu te treści nie pojawiają się u góry listy wyników wyszukiwania. Tych informacji używamy również do ulepszania naszych systemów, tak aby spam tego rodzaju nie był w ogóle uwzględniany w indeksie.

Dzięki naszym automatycznym systemom wspomaganym przez sztuczną inteligencję najlepsze wyniki wyszukiwania zawierają bardzo mało spamu. Szacujemy, że wolnych od niego jest ponad 99% stron, na które użytkownicy przechodzą z wyszukiwarki. W przypadku pozostałego, niewielkiego odsetka stron nasze zespoły podejmują ręczne działania i na podstawie uzyskanych informacji jeszcze bardziej ulepszają automatyczne systemy.

Ochrona przed innymi zagrożeniami

Googlebot i jego znajomy robot chronią Cię przed innymi nadużyciami

W 2020 roku wzmocniliśmy wysiłki, aby chronić Cię przed innymi rodzajami nadużyć. Wiele z tych zagrożeń może powodować poważne szkody finansowe i osobiste.

W 2020 roku znacznie zwiększyliśmy zasięg i skuteczność ochrony użytkowników przed oszustwami. Oszustwa online mają wiele postaci i mogą mieć negatywny wpływ na Ciebie w większym stopniu niż tradycyjny spam internetowy. Na przykład oszuści udają, że udostępniają numery telefonów do działów obsługi klienta popularnych usług i produktów, aby skłonić dzwoniących użytkowników do płatności za pomocą przelewów bankowych lub kart podarunkowych. Takie oszustwa, znane jako „oszustwa związane z obsługą klienta” lub „oszustwa związane z pomocą techniczną”, są zgłaszane przez setki tysięcy osób, a użytkownicy mogą stracić w ich wyniku setki dolarów.

Przykład oszustwa związanego z obsługą klienta w wynikach wyszukiwania

Od 2018 roku nasze systemy są w stanie chronić setki milionów wyszukiwań rocznie, wykrywając potencjalnie oszukańcze witryny. Oszuści próbowali tworzyć wiele witryn niskiej jakości z upychaniem słów kluczowych, imitacjami logo marek i numerami telefonów, pod które mieli dzwonić użytkownicy. Nasze rozwiązania oparte na algorytmach znacznie zmniejszają prawdopodobieństwo pojawienia się prób oszustwa w wynikach wyszukiwania. Jest to jeden z kilku rodzajów zabezpieczeń, które wprowadziliśmy w zeszłym roku, aby zapewnić wysoką jakość wyników wyszukiwania i bezpieczeństwo użytkowników. Naszym celem jest wyprzedzanie zagrożeń, tak aby wyniki były jak najbardziej wiarygodne. Aby jeszcze lepiej się zabezpieczyć, możesz też śledzić aktualne informacje o oszustwach.

Kolejnym aspektem, w którym rozwój sztucznej inteligencji okazał się niezwykle przydatny, jest analiza zawartości witryn. Przykładem może być sposób, w jaki pomogliśmy ulepszyć ranking stron z opiniami o produktach, witryn z informacjami i sklepów internetowych. Wyszukiwarka Google to świetny sposób wyszukiwania i znajdowania produktów przed dokonaniem zakupu. Chcemy mieć pewność, że otrzymujesz najbardziej przydatne informacje na temat kolejnego zakupu, dlatego nagradzamy treści, które zawierają bardziej szczegółowe informacje.

Mimo znacznych postępów w zakresie walki ze spamem spamerzy są bardzo zmotywowani do opracowywania nowych technik, które mogą ominąć nasze systemy wykrywania. Nieustannie pracujemy nad ulepszaniem naszych usług i zabezpieczaniem ich przed różnymi rodzajami nadużyć. Mogą nam w tym pomóc raporty zewnętrzne. Czy masz ostatnie doświadczenia związane z wyszukiwarką, które miały cechy wprowadzenia w błąd, oszustwa lub spamu? A może uważasz, że możemy skuteczniej zapobiegać takim sytuacjom? Jeśli tak, podziel się swoją opinią, przekazując zapytanie i inne przydatne informacje przy użyciu raportu na temat spamu.

Googlebot współpracuje z Tobą, aby walczyć ze spamem