Panduan ini menjelaskan informasi penting tentang data yang Anda lihat dalam laporan yang dibuat menggunakan Google Analytics Data API. Pengguna sering kali menemukan perbedaan antara data yang ditampilkan oleh API (khususnya metode runReport) dan data yang ditampilkan di UI Google Analytics.
Pengambilan sampel dan agregasi
Metode runReport Google Analytics Data API dapat menampilkan sampel data, terutama untuk set data besar atau kueri yang kompleks. Meskipun UI Google Analytics juga menerapkan pengambilan sampel, algoritma dan volume minimum tertentu dapat berbeda, sehingga menyebabkan sedikit perbedaan dalam nilai yang dilaporkan.
Untuk memahami apakah hasil laporan didasarkan pada subkumpulan data yang tersedia, periksa kolom samplingMetadatas objek ResponseMetaData. Jika hasil laporan diambil sampelnya,
kolom ini menjelaskan persentase peristiwa yang digunakan dalam laporan ini.
Metode pelaporan tertentu di Google Analytics Data API memungkinkan Anda menentukan tingkat sampling yang diinginkan. Anda dapat menggunakan kolom
samplingLevel
dari metode properties.reportTasks.create
untuk mengontrol tingkat pengambilan sampel laporan.
Fitur ini memberi properti Google Analytics 360 akses ke batas sampling yang lebih tinggi, yaitu 1 miliar peristiwa. Selain itu, batas pengambilan sampel dapat ditetapkan ke UNSAMPLED
untuk menggunakan hasil tanpa sampel untuk jumlah peristiwa yang besar.
Untuk mengetahui informasi selengkapnya, lihat Tentang pengambilan sampel data.
Perkiraan jumlah unik
Google Analytics Data API menggunakan algoritma HyperLogLog++ (HLL++) untuk memperkirakan jumlah unik untuk metrik seperti Pengguna Aktif dan Sesi. Pendekatan ini digunakan di API dan UI Google Analytics untuk meningkatkan performa dan mengelola set data besar secara efisien, yang berarti hasilnya adalah perkiraan, bukan jumlah yang tepat.
Untuk konteks tambahan, lihat referensi berikut: Perkiraan jumlah unik di Google Analytics dan Perbedaan jumlah pengguna.
Nilai minimum data
Google Analytics dapat menerapkan volume minimum data pada laporan untuk mencegah identifikasi masing-masing pengguna berdasarkan demografi, minat, atau sinyal lain yang ada dalam data.
Jika baris laporan berisi sejumlah kecil pengguna, baris tersebut dapat dikecualikan dari hasil. Hal ini lebih umum terjadi pada laporan yang menyertakan dimensi atau dimensi kustom dengan kardinalitas tinggi.
Untuk memahami apakah laporan ini tunduk pada penerapan nilai minimum, periksa kolom
subjectToThresholding
objek ResponseMetaData.
Untuk mengetahui informasi selengkapnya, lihat Volume minimum data.
Baris (other)
Jika dimensi memiliki kardinalitas tinggi, Google Analytics dapat mengelompokkan nilai yang kurang umum ke dalam baris yang diberi label (other). Hal ini lebih umum terjadi dalam laporan yang menyertakan dimensi dengan lebih dari 500 nilai unik per hari.
Saat menggunakan filter dengan Data API, perhatikan bahwa filter tidak melihat ke dalam baris (other), dan diterapkan setelah data digabungkan dan baris (other) dibuat.
Untuk memahami apakah laporan berisi data yang digabungkan ke dalam baris (other), periksa kolom dataLossFromOtherRow objek ResponseMetaData.
Untuk mengetahui informasi selengkapnya, lihat Baris(lainnya) di Google Analytics 4.
Identitas pelaporan
Identitas pelaporan menentukan cara pengguna dihapus duplikatnya dalam laporan. Setelan identitas yang berbeda (seperti "Gabungan" atau "Berbasis perangkat") dapat menghasilkan jumlah pengguna yang berbeda untuk rentang tanggal yang sama.
UI Google Analytics dan Data API menggunakan setelan identitas pelaporan yang sama untuk properti Anda. Jika setelan ini diubah, laporan di UI dan API akan terpengaruh. Jika setelan diubah antara menjalankan laporan di UI dan mendapatkan data laporan melalui API, jumlah pengguna mungkin berbeda antara kedua laporan untuk rentang tanggal yang sama.
Kekhususan kueri
Untuk meminimalkan perbedaan, pastikan parameter berikut dalam permintaan API Anda cocok dengan setelan dalam laporan UI Google Analytics:
- Rentang tanggal: Pastikan tanggal mulai dan akhir identik.
- Dimensi dan metrik: Pastikan dimensi dan metrik dalam permintaan API Anda sama dengan dimensi dan metrik dalam laporan UI Google Analytics.
- Filter: Pastikan semua filter dimensi atau metrik yang diterapkan dalam permintaan API cocok dengan yang digunakan di UI.
Menambahkan dimensi ke laporan dapat menyebabkan lebih sedikit peristiwa yang digunakan dalam penghitungan. Hanya peristiwa yang berisi data untuk dimensi yang diminta yang disertakan dalam laporan. Akibatnya, penambahan dimensi ke kueri dapat mengubah nilai gabungan untuk metrik dalam laporan.
Keaktualan data
Google Analytics membutuhkan waktu untuk memproses dan menggabungkan data peristiwa. Saat bekerja dengan data yang sangat baru, Anda mungkin melihat sedikit perbedaan antara laporan jika ada jeda waktu antara pengambilan data. Misalnya, jika Anda melihat laporan di UI, lalu mengkueri API untuk laporan yang sama beberapa menit kemudian, data mungkin telah berubah karena pemrosesan dan penggabungan yang sedang berlangsung.
Untuk mengetahui informasi selengkapnya, lihat Keaktualan Data.
Alternatif data tanpa sampel
Jika kasus penggunaan Anda memerlukan data tingkat peristiwa yang lengkap dan tidak disampel, pertimbangkan untuk menggunakan alternatif berikut:
BigQuery Export: BigQuery Export untuk Google Analytics
adalah metode yang direkomendasikan untuk analisis lanjutan data peristiwa mentah.
Analytics 360: Properti dengan lisensi Analytics 360 memiliki batas pengambilan sampel yang lebih tinggi dan akses ke fitur pelaporan yang lebih mendetail.