Verileri anlama
Yerleştirmeler birden fazla ülkede kullanılabilirken şema tüm veri kümelerinde tutarlı kalır. Yerleştirmeler, her ülke için ayrı BigQuery listelemeleri halinde düzenlenir.
Yerleştirme vektörünün anatomisi
features sütunu, 330 boyutlu bir vektördür (BigQuery'de REPEATED FLOAT dizisi olarak depolanır). Dizinin her bölümü, Nüfus Dinamiği modeli tarafından çıkarılan belirli bir veri sinyaline karşılık gelir.
Bu yapıyı anlamak, özelliklerin kaldırılmasına (ör. arama davranışının satışları hava durumuna kıyasla ne kadar öngördüğünü belirleme) olanak tanır.
| Vektör dizinleri | Veri kaynağı | Açıklama |
|---|---|---|
| 0-127 | Toplu Arama Trendleri | Bölgesel ilgi alanlarını ve endişeleri (örneğin, "spor salonu", "grip belirtileri", "lüks ürünler" aramaları) yakalar. |
| 128-255 | Haritalar ve Yoğunluk | Yerleşim alanlarını (hastaneler, parklar, okullar gibi ÖY'ler) ve insan faaliyetlerinin yoğunluğunu gösterir. |
| 256 – 329 | Hava Durumu ve Hava Kalitesi | Çevresel bağlamı (sıcaklık, yağış, HKİ, rüzgar) yakalar. |
Önemli sütunlar ve meta veriler
Yerleştirme tablosu, coğrafi analiz, filtreleme ve diğer Google Haritalar Platformu hizmetleriyle birlikte çalışabilirlik sağlayan mekansal meta verileri içerir.
geo_id: Bölgenin birincil tanımlayıcısı. S2 hücresi veri kümeleri için bu, onaltılık dize olarak gösterilen S2 hücresi jetonudur (örneğin,'80ead45'). Bunu birincil birleştirme anahtarınız olarak kullanın.geo_name: Bölgenin insan tarafından okunabilir adı. Not: S2 ızgara veri kümelerinde matematiksel hücrelerin standart adları yoktur. Bu nedenle bu sütun,geo_idile aynı jetonu içerir. Bu, tüm Nüfus Dinamikleri tekliflerinde tutarlı bir sütun yapısı sağlamak için tasarlanmıştır.administrative_area_level_1_id: En üst düzeydeki idari sınır için benzersiz Google Haritalar Yer Kimliği (ör. eyalet veya il).administrative_area_level_1_name: En üst düzey sınıra ait, insan tarafından okunabilen ad (ör.'California').administrative_area_level_2_id: İkincil idari sınır için benzersiz Google Haritalar Yer Kimliği (ör. ilçe).administrative_area_level_2_name: İkincil sınırın kullanıcılar tarafından okunabilen adı (örneğin,'Tulare County').features: Yerel olarakARRAY<FLOAT64>olarak depolanan 330 boyutlu temel yerleştirme vektörü. Bunu Pandas Python kitaplığına yüklemek için düzleştirilmesi veya NumPy matrisine dönüştürülmesi gerekir.
Sık sorulan sorular (SSS)
Ham giriş verilerine (ör. belirli arama sorguları veya hareketlilik izleri) erişebilir miyim?
Hayır. Nüfus Dinamikleri Analizleri yerleştirmeleri, gizliliği koruyan toplu sinyallerden oluşturulur. Kullanıcı gizliliğini sağlamak için belirli kullanıcı izleri, bireysel arama geçmişleri veya ham hareket kalıpları sağlamayız. Yerleştirmeler, bu davranışların ham analiz yerine modelleme ve tahmin için optimize edilmiş bir örtülü gösterimini sağlar.
Vektör boyutları yorumlanabilir mi? (Örneğin, 5. boyut "Kahve" mi?)
Vektörler, belirli ve insan tarafından okunabilen etiketler yerine soyut kalıpları yakalayan gizli temsillerdir. 0-127 arasındaki indekslerin Arama Trendleri'nden elde edildiğini biliyoruz ancak belirli bir indeks (ör. 5. indeks), "Kahve" gibi tek bir anahtar kelimeyle bire bir eşleşmez. Bunun yerine, modelin öğrendiği karmaşık bir arama davranışı özelliğini temsil eder.
Veri kümesi poligon sınırları (şekil dosyaları) içeriyor mu?
Veri kümesi, coğrafi tanımlayıcılar (ör. 1. ve 2. düzey idari bölgeler) için S2 hücre kimlikleri (geo_id) ve yer kimlikleri sağlar ancak bölgelerin ham poligon geometrisini (WKT/Shapefile) içermez.
- Görselleştirme için: BigQuery GeoViz gibi araçları kullanarak doğrudan centroid'leri çizebilir veya S2 poligonunu onaltılık jetondan hesaplamak için geometri kitaplıklarını kullanabilirsiniz.
- Mekansal birleştirmeler için: Hassas sınır işlemleri (örneğin,
ST_CONTAINS) yapmanız gerekiyorsa bu veri kümesini herkese açık sınır veri kümeleriyle (BigQuery herkese açık verilerinde bulunur) birleştirmenizi öneririz.