Om datautvelgelse / sampling av data

Innen dataanalyse innebærer datautvelgelse, eller sampling av data, å analysere et delsett av dataene for å identifisere viktig informasjon om datasettet i sin helhet. Hvis du for eksempel vil se et anslag for antallet trær i et område på 100 mål med relativt jevn fordeling av trær, kan du telle antallet trær på ett mål og gange tallet med 100. Du kan også telle antallet trær på et halvt mål og gange det med 200, så får du et relativt nøyaktig antall for hele området på 100 mål.

I denne artikkelen forklarer vi omstendighetene der Analytics bruker sampling på øktnivå for dataene dine for å gi deg nøyaktige rapporter.

 

Denne artikkelen tar for seg følgende:

Terskler for sampling

Sampling benyttes ikke i forbindelse med standardrapporter.

Ad hoc-søk i dataene dine er underlagt følgende generelle grenser for sampling:

  • Analytics Standard: 500 000 økter på områdenivå for datoperioden du bruker
  • Analytics 360: 100 millioner økter på rapporteringsvisningsnivå for datoperioden du bruker

I enkelte tilfeller kan det hende at færre økter omfattes av samplingen. Dette kan komme av at Analytics-implementeringen din er kompleks, at du bruker filtre for rapporteringsvisninger, eller at du segmenterer utvalget med komplekse søk. Det kan også være en kombinasjon av disse tre faktorene. Vi gjør riktignok vårt ytterste for å bruke sampling opptil tersklene som er angitt ovenfor, men det er ikke utenkelig at du innimellom får returnert litt færre økter ved ad hoc-søk.

Når sampling brukes

I denne delen forklarer vi hvor du kan forvente å finne sampling for økter i Analytics-rapporter.

Standardrapporter

Analytics har et sett med forhåndskonfigurerte standardrapporter oppført i ruten til venstre under Målgruppe, Brukeranskaffelser, Atferd og Konverteringer.

I Analytics lagres ett fullstendig datasett uten filter for hvert område i hver konto. For hver eneste rapporteringsvisning i et område oppretter Analytics også tabeller med samlede dimensjoner og verdier fra de fullstendige dataene – uten filter. Når du kjører en standardrapport, søker Analytics i tabellene med aggregerte data for raskt å vise fullstendige (ikke-samplede) resultater.

Analytics legger til nye rapporter regelmessig, og noen ganger endres måtene beregningene utregnes på. Hvis datoperioden for en rapport omfatter en tidsperiode som ligger forut i tid for da rapporten ble lagt til eller utregningsmetoden for en beregning ble endret, kan Analytics legge inn et ad hoc-søk. Da blir kanskje bare et utvalg av dataene tatt med.

Ssampling brukes hvis rapporter som omfatter «Brukere»- og «Aktive brukere»-verdiene, har data som stammer fra tiden før september 2016. Finn ut mer

Standardrapportene er fullstendige (dvs. sampling benyttes ikke) i både standardutgaven av Analytics og Analytics 360. Hvis du imidlertid bruker overstyringsfunksjonen for automatisk merking, kan det forekomme sampling i enkelte av Google Ads-rapportene.

Ad hoc-rapporter

Hvis du endrer en standardrapport, for eksempel ved å bruke et filter, segmentering eller en sekundær dimensjon, eller om du oppretter en egendefinert rapport med en kombinasjon av dimensjoner og beregninger som ikke finnes i standardrapportene, genererer du et ad hoc-søk i Analytics-dataene.

Analytics går først gjennom tabellene med aggregerte data for å se om all informasjonen du har etterspurt i ad hoc-søket, er tilgjengelig der. Hvis den ikke er det, søker Analytics i det fullstendige datasettet uten filter for å oppfylle forespørselen.

Sampling foretas ved ad hoc-søk hvis antallet økter for datoperioden du bruker, overstiger grensen for områdetypen din.

I algoritmen for sampling brukes det et utvalg av de fullstendige dataene som er proporsjonalt for den daglige fordelingen av økter tilknyttet området, i den valgte datoperioden. Hvis for eksempel 25 % av øktene ble valgt ut over en periode på fem dager, inneholder utvalget 25 % av øktene for hver dag:

  Mandag Tirsdag Onsdag Torsdag Fredag
Totalt antall økter 200 000 100 000 200 000 300 000 200 000
Datautvalg på 25 % 50 000 25 000 50 000 75 000 50 000

 

Samplingsfrekvensen varierer fra søk til søk og avhenger av antallet økter i løpet av en datoperiode for en gitt rapporteringsvisning.

Når du bruker sampling, ser du denne meldingen øverst i rapporten: Denne rapporten er basert på N % av øktene.

Til høyre for meldingen kan du endre utvalgsstørrelsen ved å velge ett av disse to alternativene:

  • Større presisjon: Her brukes den største utvalgssstørrelsen som er mulig, for at du skal få resultater som representerer hele datasettet ditt mest mulig nøyaktig.
  • Raskere respons: Her brukes det en mindre utvalgsstørrelse for at du skal få resultater raskere.
Sampling controls: Greater precision or Faster response
Kontroller for sampling

Andre rapporter

Sampling fungerer på en annen måte i slike rapporter enn i standardrapporter og ad hoc-søk.

Rapporter for multikanalstrakter

Som i standardrapporter brukes ikke sampling med mindre du har endret rapporten – for eksempel ved å endre tilbakeblikksvinduet eller hvilke konverteringer som skal tas med, eller ved å legge til segmentering eller en sekundær dimensjon. Hvis du endrer rapporten på noen som helst måte, returneres et utvalg på maksimalt én million konverteringer.

Rapporter om flytvisualisering

Rapportene om flytvisualisering (inkludert Brukerflyt, Atferdsflyt, Hendelsesflyt og Målflyt) genereres ut fra maksimalt 100 000 økter i den valgte datoperioden.

Rapportene om flytvisualisering, inkludert inngangs-, utgangs- og konverteringsfrekvensen, kan skille seg fra resultatene i standardrapportene om atferd og konverteringer, som bygger på et annet datautvalgssett.

Filtre og segmenter

Analytics Standard og Analytics 360 velger ut øktdata på rapporteringsvisningsnivå etter at filtre for rapporteringsvisninger er tatt i bruk. Hvis filtrene for rapporteringsvisning for eksempel inkluderer eller ekskluderer enkelte økter, samples det bare ut data fra disse øktene.

Både i Analytics Standard og Analytics 360 legges det til segmenter etter at rapportfiltre er lagt til og samplingen er gjennomført. Dette innebærer at et segment kan inneholde færre økter enn antallet som er tatt med i det totale datautvalget.

Slik jobber du med utvalgsstørrelser

Bruk kontrollene for å bytte mellom den maksimale utvalgsstørrelsen for å få en mer nøyaktig rapport, eller en mindre utvalgsstørrelse for å få raskere svar på søket ditt.

Ett alternativ for å unngå sampling er å forkorte datoperioden for rapporten din helt til antallet økter er lavere enn grensen for sampling, dersom datavolumet ditt tilsier at dette er mulig.

Hvis du er Google Analytics 360-bruker, har du to tilleggsalternativer for å få fullstendige (ikke-samplede) rapporter:

Var dette nyttig for deg?

Hvordan kan vi forbedre den?
true
Velg din egen kursplan

Ta en titt på google.com/analytics/learn, en ny ressurs du kan bruke for å få mest mulig ut av Google Analytics 4. Det nye nettstedet inneholder videoer, artikler og veiledninger samt linker til Discord, YouTube-kanalen, bloggen og GitHub-repositoriet for Google Analytics.

Kom i gang med læringen allerede i dag!

Søk
Slett søket
Lukk søkefunksjonen
Google-apper
Hovedmeny
1884514676393046357
true
Søk i brukerstøtte
true
true
true
true
true
69256
false
false