Jenis data dan jenis semantik

Saat Anda membuat konektor komunitas, setiap kolom yang Anda tentukan dalam skema memerlukan jenis data. Jenis data menentukan jenis primitif kolom seperti BOOLEAN, STRING, NUMBER, dll.

Selain jenis data, Looker Studio juga menggunakan jenis semantik. Jenis semantik membantu mendeskripsikan jenis informasi yang diwakili oleh data. Misalnya, kolom dengan jenis data NUMBER dapat secara semantik mewakili jumlah atau persentase mata uang, dan kolom dengan jenis data STRING dapat mewakili kota secara semantik. Untuk melihat jenis semantik yang tersedia, baca dokumentasi jenis semantik

Kolom Looker Studio dan skema Community Connector

Saat Anda menentukan skema untuk konektor komunitas, ada berbagai properti untuk setiap kolom yang akan menentukan cara kolom direpresentasikan dan digunakan di Looker Studio. Contoh:

  • conceptType ditentukan dalam skema konektor Anda menggunakan properti conceptType. Properti ini menentukan apakah kolom diperlakukan sebagai dimensi atau metrik. Penjelasan tentang perbedaan antara metrik dan dimensi dapat ditemukan di bagian Dimensi dan metrik.
  • Jenis semantik dapat ditentukan dalam skema konektor, atau dapat dideteksi secara otomatis oleh Looker Studio berdasarkan properti jenis data yang ditentukan di konektor dan nilai data yang ditampilkan oleh konektor Anda. Lihat Deteksi jenis semantik otomatis untuk mengetahui detail cara kerjanya.
  • Jenis agregasi menentukan apakah nilai metrik (dimensi diabaikan) dapat diagregasi ulang. Menyetel properti semantics.isReaggregatable ke true akan ditetapkan secara default ke agregasi SUM, jika tidak, akan ditetapkan ke Auto. Anda juga dapat menetapkan jenis agregasi default secara manual untuk kolom agregasi ulang menggunakan properti defaultAggregationType.

Saat Anda mengonfigurasi dan terhubung menggunakan konektor di Looker Studio, editor kolom akan menampilkan skema lengkap untuk konektor berdasarkan cara Anda menentukan properti di atas. Jika Anda telah menyertakan jenis semantik, jenis semantik tersebut akan ditampilkan seperti yang telah Anda tentukan. Jika Anda menggunakan deteksi jenis semantik otomatis, kolom akan ditampilkan saat terdeteksi. Layar Kolom

Menyetel informasi semantik

Ada dua cara untuk menetapkan informasi semantik. Anda dapat menetapkan semantik kolom secara manual atau mengandalkan Looker Studio untuk mendeteksi secara otomatis.

Misalnya, jika Anda memiliki Angka yang secara semantik mewakili Dolar AS, Looker Studio tidak akan dapat mendeteksi jenis semantik ini secara otomatis. Selain itu, deteksi semantik otomatis memerlukan Looker Studio untuk melakukan panggilan pengambilan data untuk setiap kolom skema. Sebaliknya, jika Anda menentukan skema secara manual, tidak ada panggilan pengambilan data yang akan dilakukan. Jika Anda mengetahui jenis semantik (misalnya mata uang, persen, tanggal, dll.) untuk data Anda, sebaiknya tetapkan ini secara eksplisit dalam skema untuk alasan akurasi dan performa.

Menetapkan jenis semantik secara manual (Direkomendasikan)

Jika mengetahui jenis semantik, Anda dapat menentukan semantics secara manual untuk setiap kolom skema. Detail lengkap tentang properti yang tersedia untuk Anda dapat ditemukan di halaman referensi kolom. Jika Anda memilih untuk menentukan jenis semantik manual, sebaiknya tentukan semanticType dan semanticGroup untuk setiap kolom. Dengan memberikan properti ini secara manual, proses deteksi jenis semantik otomatis tidak akan berjalan. Jika Anda menetapkan beberapa kolom secara manual, tetapi tidak semua, maka yang tidak Anda tentukan default-nya adalah Text, Number, atau Boolean, bergantung pada dataType yang ditentukan untuk kolom tersebut.

Berikut adalah contoh skema sederhana yang menetapkan jenis semantik secara manual. Income ditetapkan sebagai Mata Uang, dan Filing Year ditetapkan sebagai tanggal.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

Pemecahan Masalah Jenis Semantik Manual

Jika Anda salah menetapkan jenis semantik untuk data pokok, jenis semantik tersebut tidak akan berfungsi dengan baik. Hal ini mungkin sulit diuji, tetapi ada beberapa hal yang dapat Anda lakukan untuk membantu menemukan masalah.

  1. Menampilkan 2 atau 3 baris dari data Anda, bukan semuanya, lalu periksa secara manual.
  2. Buat tabel di Looker Studio yang hanya menggunakan kolom yang Anda coba periksa.
  3. Perhatikan kolom Geo dan Date karena kolom tersebut memiliki format yang paling ketat.

Deteksi jenis semantik otomatis

Jika Anda belum menentukan jenis semantik apa pun dalam skema, Looker Studio akan mencoba mendeteksinya secara otomatis berdasarkan properti jenis data dan format nilai data yang ditampilkan oleh konektor Anda.

Langkah-langkah proses deteksi otomatis adalah sebagai berikut:

  1. Minta skema dengan menjalankan fungsi getSchema dari konektor komunitas Anda.
  2. Lakukan iterasi melalui batch kolom yang ditentukan dalam skema konektor, lalu masalah getData akan meminta kolom. Permintaan getData dijalankan dengan parameter sampleExtraction yang ditetapkan ke true untuk menunjukkan bahwa permintaan data untuk tujuan deteksi semantik.
  3. Berdasarkan jenis data kolom dan format nilai yang ditampilkan dari permintaan getData, identifikasi jenis semantik kolom tersebut.

Opsi untuk menangani deteksi jenis semantik otomatis

Saat Looker Studio menjalankan fungsi getData konektor komunitas untuk tujuan deteksi semantik, permintaan masuk akan berisi properti sampleExtraction yang akan ditetapkan ke true. Data yang ditampilkan oleh konektor Anda hanya digunakan oleh Looker Studio untuk mengidentifikasi jenis semantik kolom. Karena tidak akan digunakan untuk tujuan lain, nilai ini tidak memerlukan data aktual dari sumber eksternal.

Ada beberapa cara untuk meningkatkan deteksi jenis semantik dalam kode Anda:

  • Direkomendasikan: Teruskan nilai yang telah ditetapkan
    Menampilkan nilai yang telah ditentukan untuk setiap kolom yang paling mewakili jenis semantik untuk kolom tersebut dan dapat dideteksi dengan benar oleh Looker Studio. Misalnya, jika jenis semantik untuk kolom adalah Country, tampilkan nilai seperti IT untuk Italia. Manfaat lain dari pendekatan ini adalah prosesnya jauh lebih cepat karena tidak mengharuskan Anda membuat permintaan HTTP ke layanan pihak ketiga untuk data.

  • Hanya menampilkan n jumlah data
    Jika layanan pihak ketiga tempat Anda mengambil data mendukung batas baris saat meminta data, tampilkan sebagian kecil baris ke Looker Studio, bukan kumpulan data lengkap. Tindakan ini akan membatasi jumlah data yang perlu Anda teruskan ke Looker Studio untuk setiap permintaan deteksi semantik.

  • Minta semua kolom dan cache respons
    Jika mungkin untuk meminta semua kolom untuk layanan pihak ketiga tempat Anda mengambil data, pada permintaan deteksi semantik pertama yang diterima dari Looker Studio, ambil semua kolom dan simpan hasilnya di cache. Untuk permintaan deteksi semantik berikutnya, ambil nilai kolom dari cache, bukan membuat permintaan HTTP tambahan ke layanan pihak ketiga.

  • Tidak melakukan apa pun
    Anda dapat memilih untuk tidak menerapkan akomodasi tertentu untuk permintaan yang sampleExtraction ditetapkan ke true. Hal ini akan menyebabkan proses Deteksi Semantik menjadi lebih lambat karena Looker Studio harus mengambil semua data untuk proses Deteksi Semantik. Selain itu, hal ini akan memengaruhi rasio permintaan ke sumber data eksternal Anda karena banyak permintaan deteksi semantik akan dijalankan secara paralel.

Format yang dikenali untuk deteksi jenis semantik otomatis

Tanggal & Waktu
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Waktu: epoch untuk detik, mikro, mili, dan nano.
Geografis