Nasza walka ze spamem w wyszukiwarce w 2020 roku

Czwartek, 29 kwietnia 2021 roku

Googlebot i jego znajomy robot czytają raport na temat spamu internetowego w 2020 roku

Wyszukiwarka Google to zaawansowane narzędzie, które ułatwia znajdowanie przydatnych informacji w otwartym internecie. Niestety, nie wszyscy twórcy stron internetowych mają dobre intencje. Wielu z nich specjalnie tworzy strony wprowadzające użytkowników w błąd, a my walczymy z tym procederem każdego dnia. Aby zapewnić Ci wygodę wyszukiwania, a także ochronę przed szkodliwymi treściami i działaniami, w 2020 roku wprowadziliśmy w wyszukiwarce Google wiele innowacji.

Skuteczniejsza walka ze spamem

Chociaż od początku istnienia naszej wyszukiwarki walczymy ze spamem, najnowsze postępy w dziedzinie sztucznej inteligencji pozwoliły nam osiągnąć niebywały przełom.

Dzięki połączeniu tej technologii i naszej szczegółowej wiedzy na temat spamu w ubiegłym roku udało nam się opracować własny system AI do walki ze spamem, który niezwykle skutecznie wykrywa znane i nowe zagrożenia tego rodzaju. Na przykład w porównaniu do stanu sprzed kilku lat ograniczyliśmy liczbę stron z automatycznie generowanymi i powielanymi treściami o ponad 80%.

W 2020 roku treści spamerskie umieszczane przez hakerów były nadal często widoczne, ponieważ liczba zagrożonych witryn pozostawała dość duża, ale zwiększyliśmy nasze możliwości wykrywania o ponad 50% i większość takiego spamu usunęliśmy z wyników wyszukiwania.

Tego problemu nie możemy rozwiązać samodzielnie. Nawet jeśli będziemy wykrywać cały spam i chronić przed nim użytkowników, hakerzy nadal będą wykorzystywali luki w zabezpieczeniach, dopóki nie zostaną one usunięte. Właściciele witryn mogą zadbać o bezpieczeństwo, przestrzegając zasad skutecznej ochrony, bo łatwiej jest zapobiegać atakom hakerów niż usuwać ich skutki. Google udostępnia zasoby, które pomagają poznać najczęstsze sposoby przeprowadzania ataków na witryny i dowiedzieć się, jak używać Search Console do sprawdzania, czy witryna została zaatakowana przez hakerów. Zapoznaj się z nimi, abyśmy mogli wspólnie chronić internet.

W ubiegłym roku miały miejsce ważne wydarzenia, w tym wybuch globalnej pandemii. Dlatego znaczną część wysiłków poświęciliśmy na ochronę miliardów wyszukiwań związanych z tymi zagadnieniami. Ktoś, kto szuka miejsca wykonywania testów na COVID-19, nie powinien natrafiać na bezsensowne strony ze spamem, które mogą przekierowywać do witryn wyłudzających informacje. Oprócz walki z treściami spamerskimi nawiązaliśmy współpracę z innymi zespołami zajmującymi się wyszukiwarką, aby zapewnić użytkownikom dostęp do najbardziej aktualnych, najlepszych informacji w odpowiednim miejscu i czasie.

Zapobieganie pojawianiu się spamu u użytkowników

Zanim Google wyświetli zestaw wyników wyszukiwania, w tle dzieje się wiele rzeczy. Codziennie odkrywamy, skanujemy i indeksujemy miliardy stron internetowych. Wśród nich znajduje się mnóstwo spamu – każdego dnia znajdujemy 40 miliardów stron, które go zawierają. Dowiedz się, jak staramy się wyeliminować ten spam z wyników wyszukiwania, aby zapewnić dostęp do przydatnych informacji.

Jak zapewniamy ochronę przed spamem na każdym etapie — Ten schemat przedstawia sposób ochrony przed spamem.

Przede wszystkim nasze systemy wykrywają spam podczas indeksowania stron i innych treści. Skanujemy treści, gdy nasze automatyczne systemy odwiedzają strony i decydują o ich uwzględnieniu w indeksie używanym do dostarczania wyników wyszukiwania. Niektóre treści uznane za spam nie są dodawane do indeksu.

Te systemy działają też w przypadku treści wykrywanych za pomocą witryn i Search Console. Na przykład w Search Console jest dostępna funkcja Poproś o zindeksowanie pozwalająca twórcom informować nas o nowych stronach, które powinny zostać szybko dodane. Zauważyliśmy, że spamerzy atakują niezabezpieczone witryny, podszywając się pod ich właścicieli, weryfikując się w Search Console i używając tego narzędzia do przesyłania do Google próśb o zindeksowanie wielu utworzonych przez nich stron ze spamem. Sztuczna inteligencja umożliwiła nam identyfikowanie podejrzanych przypadków weryfikacji i zapobieganie dodawaniu adresów URL ze spamem do naszego indeksu.

Korzystamy też z systemów, które analizują treści uwzględnione w naszym indeksie. Gdy użytkownik przeprowadza wyszukiwanie, systemy te sprawdzają, czy treści pasujące do wyszukiwanego hasła nie zawierają spamu. W przypadku wykrycia spamu te treści nie pojawiają się u góry listy wyników wyszukiwania. Tych informacji używamy również do ulepszania naszych systemów, tak aby spam tego rodzaju nie był w ogóle uwzględniany w indeksie.

Dzięki naszym automatycznym systemom wspomaganym przez sztuczną inteligencję najlepsze wyniki wyszukiwania zawierają bardzo mało spamu. Szacujemy, że wolnych od niego jest ponad 99% stron, na które użytkownicy przechodzą z wyszukiwarki. W przypadku pozostałego, niewielkiego odsetka stron nasze zespoły podejmują ręczne działania i na podstawie uzyskanych informacji jeszcze bardziej ulepszają automatyczne systemy.

Ochrona przed innymi zagrożeniami

Googlebot i jego znajomy robot chronią Cię przed innymi nadużyciami

W 2020 roku wzmocniliśmy wysiłki, aby chronić Cię przed innymi rodzajami nadużyć. Wiele z tych zagrożeń może powodować poważne szkody finansowe i osobiste.

W 2020 roku znacznie zwiększyliśmy zasięg i skuteczność ochrony użytkowników przed oszustwami. Oszustwa online mają wiele postaci i mogą mieć negatywny wpływ na Ciebie w większym stopniu niż tradycyjny spam internetowy. Na przykład oszuści udają, że udostępniają numery telefonów do działów obsługi klienta popularnych usług i produktów, aby skłonić dzwoniących użytkowników do płatności za pomocą przelewów bankowych lub kart podarunkowych. Takie oszustwa, znane jako „oszustwa związane z obsługą klienta” lub „oszustwa związane z pomocą techniczną”, są zgłaszane przez setki tysięcy osób, a użytkownicy mogą stracić w ich wyniku setki dolarów.

Przykład oszustwa związanego z obsługą klienta w wynikach wyszukiwania

Od 2018 roku nasze systemy są w stanie chronić setki milionów wyszukiwań rocznie, wykrywając potencjalnie oszukańcze witryny. Oszuści próbowali tworzyć wiele witryn niskiej jakości z upychaniem słów kluczowych, imitacjami logo marek i numerami telefonów, pod które mieli dzwonić użytkownicy. Nasze rozwiązania oparte na algorytmach znacznie zmniejszają prawdopodobieństwo pojawienia się prób oszustwa w wynikach wyszukiwania. Jest to jeden z kilku rodzajów zabezpieczeń, które wprowadziliśmy w zeszłym roku, aby zapewnić wysoką jakość wyników wyszukiwania i bezpieczeństwo użytkowników. Naszym celem jest wyprzedzanie zagrożeń, tak aby wyniki były jak najbardziej wiarygodne. Aby jeszcze lepiej się zabezpieczyć, możesz też śledzić aktualne informacje o oszustwach.

Kolejnym aspektem, w którym rozwój sztucznej inteligencji okazał się niezwykle przydatny, jest analiza zawartości witryn. Przykładem może być sposób, w jaki pomogliśmy ulepszyć ranking stron z opiniami o produktach, witryn z informacjami i sklepów internetowych. Wyszukiwarka Google to świetny sposób wyszukiwania i znajdowania produktów przed dokonaniem zakupu. Chcemy mieć pewność, że otrzymujesz najbardziej przydatne informacje na temat kolejnego zakupu, dlatego nagradzamy treści, które zawierają bardziej szczegółowe informacje.

Mimo znacznych postępów w zakresie walki ze spamem spamerzy są bardzo zmotywowani do opracowywania nowych technik, które mogą ominąć nasze systemy wykrywania. Nieustannie pracujemy nad ulepszaniem naszych usług i zabezpieczaniem ich przed różnymi rodzajami nadużyć. Mogą nam w tym pomóc raporty zewnętrzne. Czy masz ostatnie doświadczenia związane z wyszukiwarką, które miały cechy wprowadzenia w błąd, oszustwa lub spamu? A może uważasz, że możemy skuteczniej zapobiegać takim sytuacjom? Jeśli tak, podziel się swoją opinią, przekazując zapytanie i inne przydatne informacje przy użyciu raportu na temat spamu.

Googlebot współpracuje z Tobą, aby walczyć ze spamem

Autor: Cody Kwok, Principal Engineer

Nasza walka ze spamem w wyszukiwarce w 2020 roku Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Skuteczniejsza walka ze spamem

Zapobieganie pojawianiu się spamu u użytkowników

Ochrona przed innymi zagrożeniami

Nasza walka ze spamem w wyszukiwarce w 2020 roku