Innen dataanalyse innebærer datautvelgelse, eller sampling av data, å analysere et delsett av dataene for å identifisere viktig informasjon om datasettet i sin helhet. Hvis du for eksempel vil se et anslag for antallet trær i et område på 100 mål med relativt jevn fordeling av trær, kan du telle antallet trær på ett mål og gange tallet med 100. Du kan også telle antallet trær på et halvt mål og gange det med 200, så får du et relativt nøyaktig antall for hele området på 100 mål.
I denne artikkelen forklarer vi omstendighetene der Analytics bruker sampling på øktnivå for dataene dine for å gi deg nøyaktige rapporter.
Denne artikkelen tar for seg følgende:
Terskler for sampling
Sampling benyttes ikke i forbindelse med standardrapporter.
Ad hoc-søk i dataene dine er underlagt følgende generelle grenser for sampling:
- Analytics Standard: 500 000 økter på områdenivå for datoperioden du bruker
- Analytics 360: 100 millioner økter på rapporteringsvisningsnivå for datoperioden du bruker
I enkelte tilfeller kan det hende at færre økter omfattes av samplingen. Dette kan komme av at Analytics-implementeringen din er kompleks, at du bruker filtre for rapporteringsvisninger, eller at du segmenterer utvalget med komplekse søk. Det kan også være en kombinasjon av disse tre faktorene. Vi gjør riktignok vårt ytterste for å bruke sampling opptil tersklene som er angitt ovenfor, men det er ikke utenkelig at du innimellom får returnert litt færre økter ved ad hoc-søk.
Når sampling brukes
I denne delen forklarer vi hvor du kan forvente å finne sampling for økter i Analytics-rapporter.
Standardrapporter
Analytics har et sett med forhåndskonfigurerte standardrapporter oppført i ruten til venstre under Målgruppe, Brukeranskaffelser, Atferd og Konverteringer.
I Analytics lagres ett fullstendig datasett uten filter for hvert område i hver konto. For hver eneste rapporteringsvisning i et område oppretter Analytics også tabeller med samlede dimensjoner og verdier fra de fullstendige dataene – uten filter. Når du kjører en standardrapport, søker Analytics i tabellene med aggregerte data for raskt å vise fullstendige (ikke-samplede) resultater.
Analytics legger til nye rapporter regelmessig, og noen ganger endres måtene beregningene utregnes på. Hvis datoperioden for en rapport omfatter en tidsperiode som ligger forut i tid for da rapporten ble lagt til eller utregningsmetoden for en beregning ble endret, kan Analytics legge inn et ad hoc-søk. Da blir kanskje bare et utvalg av dataene tatt med.
Ssampling brukes hvis rapporter som omfatter «Brukere»- og «Aktive brukere»-verdiene, har data som stammer fra tiden før september 2016. Finn ut mer
Standardrapportene er fullstendige (dvs. sampling benyttes ikke) i både standardutgaven av Analytics og Analytics 360. Hvis du imidlertid bruker overstyringsfunksjonen for automatisk merking, kan det forekomme sampling i enkelte av Google Ads-rapportene.
Ad hoc-rapporter
Hvis du endrer en standardrapport, for eksempel ved å bruke et filter, segmentering eller en sekundær dimensjon, eller om du oppretter en egendefinert rapport med en kombinasjon av dimensjoner og beregninger som ikke finnes i standardrapportene, genererer du et ad hoc-søk i Analytics-dataene.
Analytics går først gjennom tabellene med aggregerte data for å se om all informasjonen du har etterspurt i ad hoc-søket, er tilgjengelig der. Hvis den ikke er det, søker Analytics i det fullstendige datasettet uten filter for å oppfylle forespørselen.
Sampling foretas ved ad hoc-søk hvis antallet økter for datoperioden du bruker, overstiger grensen for områdetypen din.
I algoritmen for sampling brukes det et utvalg av de fullstendige dataene som er proporsjonalt for den daglige fordelingen av økter tilknyttet området, i den valgte datoperioden. Hvis for eksempel 25 % av øktene ble valgt ut over en periode på fem dager, inneholder utvalget 25 % av øktene for hver dag:
Mandag | Tirsdag | Onsdag | Torsdag | Fredag | |
---|---|---|---|---|---|
Totalt antall økter | 200 000 | 100 000 | 200 000 | 300 000 | 200 000 |
Datautvalg på 25 % | 50 000 | 25 000 | 50 000 | 75 000 | 50 000 |
Samplingsfrekvensen varierer fra søk til søk og avhenger av antallet økter i løpet av en datoperiode for en gitt rapporteringsvisning.
Når du bruker sampling, ser du denne meldingen øverst i rapporten: Denne rapporten er basert på N % av øktene.
Til høyre for meldingen kan du endre utvalgsstørrelsen ved å velge ett av disse to alternativene:
- Større presisjon: Her brukes den største utvalgssstørrelsen som er mulig, for at du skal få resultater som representerer hele datasettet ditt mest mulig nøyaktig.
- Raskere respons: Her brukes det en mindre utvalgsstørrelse for at du skal få resultater raskere.
Andre rapporter
Sampling fungerer på en annen måte i slike rapporter enn i standardrapporter og ad hoc-søk.
Rapporter for multikanalstrakter
Som i standardrapporter brukes ikke sampling med mindre du har endret rapporten – for eksempel ved å endre tilbakeblikksvinduet eller hvilke konverteringer som skal tas med, eller ved å legge til segmentering eller en sekundær dimensjon. Hvis du endrer rapporten på noen som helst måte, returneres et utvalg på maksimalt én million konverteringer.
Rapporter om flytvisualisering
Rapportene om flytvisualisering (inkludert Brukerflyt, Atferdsflyt, Hendelsesflyt og Målflyt) genereres ut fra maksimalt 100 000 økter i den valgte datoperioden.
Rapportene om flytvisualisering, inkludert inngangs-, utgangs- og konverteringsfrekvensen, kan skille seg fra resultatene i standardrapportene om atferd og konverteringer, som bygger på et annet datautvalgssett.
Filtre og segmenter
Analytics Standard og Analytics 360 velger ut øktdata på rapporteringsvisningsnivå etter at filtre for rapporteringsvisninger er tatt i bruk. Hvis filtrene for rapporteringsvisning for eksempel inkluderer eller ekskluderer enkelte økter, samples det bare ut data fra disse øktene.
Både i Analytics Standard og Analytics 360 legges det til segmenter etter at rapportfiltre er lagt til og samplingen er gjennomført. Dette innebærer at et segment kan inneholde færre økter enn antallet som er tatt med i det totale datautvalget.
Slik jobber du med utvalgsstørrelser
Bruk kontrollene for å bytte mellom den maksimale utvalgsstørrelsen for å få en mer nøyaktig rapport, eller en mindre utvalgsstørrelse for å få raskere svar på søket ditt.
Ett alternativ for å unngå sampling er å forkorte datoperioden for rapporten din helt til antallet økter er lavere enn grensen for sampling, dersom datavolumet ditt tilsier at dette er mulig.
Hvis du er Google Analytics 360-bruker, har du to tilleggsalternativer for å få fullstendige (ikke-samplede) rapporter:
- For rapporter til engangsbruk kan du laste ned en rapport uten sampling, altså en fullstendig rapport.
- For kontinuerlig rapportering kan du opprette en egendefinert tabell.