Questo documento descrive i prerequisiti, le best practice e gli errori comuni quando si lavora con i set di dati.
Prerequisiti
Quando crei un set di dati:
- I nomi visualizzati devono essere univoci all'interno del progetto Google Cloud.
- I nomi visualizzati devono contenere meno di 64 byte (poiché questi caratteri sono rappresentati in UTF-8, in alcune lingue ogni carattere può essere rappresentato da più byte).
- Le descrizioni devono contenere meno di 1000 byte.
Durante il caricamento dei dati:
- I tipi di file supportati sono CSV, GeoJSON e KML.
- La dimensione massima supportata per i file è 500 MB.
- I nomi delle colonne degli attributi non possono iniziare con la stringa "?_".
- Le geometrie tridimensionali non sono supportate. Ciò include il suffisso "Z" nel formato WKT e la coordinata di altitudine nel formato GeoJSON.
Best practice per la preparazione dei dati
Se i dati di origine sono complessi o di grandi dimensioni, ad esempio punti densi, linestring o poligoni lunghi (spesso le dimensioni dei file di origine superiori a 50 MB rientrano in questa categoria), valuta la possibilità di semplificare i dati prima di caricarli per ottenere il miglior rendimento in una mappa visiva.
Di seguito sono riportate alcune best practice per preparare i dati:
- Ridurre al minimo le proprietà delle funzionalità. Conserva solo le proprietà delle funzionalità necessarie per lo stile della mappa, ad esempio "id" e "category". Puoi unire proprietà aggiuntive a una funzionalità in un'applicazione client utilizzando stili basati sui dati su una chiave identificatore univoca. Ad esempio, consulta Visualizzare i dati in tempo reale con gli stili basati sui dati.
- Utilizza tipi di dati semplici per gli oggetti delle proprietà, ad esempio numeri interi, per ridurre al minimo le dimensioni dei riquadri e migliorare il rendimento della mappa.
- Semplifica le geometrie complesse prima di caricare un file. Puoi farlo in uno strumento geospaziale a tua scelta, ad esempio l'utilità Mapshaper.org open source o in BigQuery utilizzando ST_Simplify su geometrie poligonali complesse.
- Raggruppa i punti molto densi prima di caricare un file. Puoi farlo in uno strumento geospaziale a tua scelta, ad esempio le funzioni di clustering turf.js open source o in BigQuery utilizzando ST_CLUSTERDBSCAN su geometrie di punti densi.
Consulta ulteriori indicazioni sulle best practice per i set di dati in Visualizzare i dati con i set di dati e BigQuery.
Requisiti GeoJSON
L'API Maps Datasets supporta l'attuale specifica GeoJSON. L'API Maps Datasets supporta anche i file GeoJSON che contengono uno dei seguenti tipi di oggetti:
- Oggetti geometrici. Un oggetto geometria è una forma spaziale, descritta come un'unione di punti, linee e poligoni con fori facoltativi.
- Oggetti delle funzionalità. Un oggetto funzionalità contiene una geometria più coppie nome/valore aggiuntive, il cui significato è specifico dell'applicazione.
- Raccolte di funzionalità. Una raccolta di caratteristiche è un insieme di oggetti caratteristica.
L'API Maps Datasets non supporta i file GeoJSON con dati in un sistema di riferimento delle coordinate (CRS) diverso da WGS84.
Per saperne di più su GeoJSON, consulta la pagina Conforme a RFC 7946.
Requisiti KML
L'API Maps Datasets presenta i seguenti requisiti:
- Tutti gli URL devono essere locali (o relativi) al file stesso.
- Sono supportate le geometrie di punti, linee e poligoni.
- Tutti gli attributi dei dati vengono considerati stringhe.
- Icone o
<styleUrl>
definiti al di fuori del file. - Link di rete, ad esempio
<NetworkLink>
- Overlay del suolo, ad esempio
<GroundOverlay>
- Geometrie 3D o tag correlati all'altitudine, ad esempio
<altitudeMode>
- Specifiche della videocamera, ad esempio
<LookAt>
- Stili definiti all'interno del file KML.
Requisiti CSV
Per i file CSV, i nomi delle colonne supportati sono elencati di seguito in ordine di priorità:
latitude
,longitude
lat
,long
x
,y
wkt
(Well-Known Text)address
,city
,state
,zip
address
- Una singola colonna contenente tutte le informazioni sull'indirizzo, ad esempio
1600 Amphitheatre Parkway Mountain View, CA 94043
Ad esempio, il file contiene le colonne denominate x
, y
e wkt
.
Poiché x
e y
hanno una priorità più alta, come determinato dall'ordine dei
nomi delle colonne supportati nell'elenco precedente, vengono utilizzati i valori nelle colonne x
e y
e la colonna wkt
viene ignorata.
Inoltre:
- Ogni nome di colonna deve appartenere a una sola colonna. ovvero non puoi avere una colonna denominata
xy
che contenga sia i dati delle coordinate x che y. Le coordinate x e y devono trovarsi in colonne separate. - I nomi delle colonne non fanno distinzione tra maiuscole e minuscole.
- L'ordine dei nomi delle colonne non è importante. Ad esempio, se il file CSV contiene
le colonne
lat
elong
, queste possono essere visualizzate in qualsiasi ordine.
Gestire gli errori di caricamento dei dati
Quando carichi dati in un set di dati, potresti riscontrare uno degli errori comuni descritti in questa sezione.
Errori GeoJSON
Gli errori comuni di GeoJSON includono:
- Campo
type
mancante otype
non è una stringa. Il file di dati GeoJSON caricato deve contenere un campo stringa denominatotype
come parte di ogni definizione di oggetto Feature e oggetto Geometry.
Errori KML
Gli errori KML comuni includono:
- Il file di dati non deve contenere nessuna delle funzionalità KML non supportate elencate sopra, altrimenti l'importazione dei dati potrebbe non riuscire.
Errori CSV
Gli errori comuni dei file CSV includono:
- In alcune righe mancano i valori per una colonna di geometria. Tutte le righe di un file CSV devono contenere
valori non vuoti per le colonne della geometria. Le colonne di geometria includono:
latitude
,longitude
lat
,long
x
,y
wkt
address
,city
,state
,zip
address
- Una singola colonna contenente tutte le informazioni sull'indirizzo, ad esempio
1600 Amphitheatre Parkway Mountain View, CA 94043
- Se
x
ey
sono le colonne di geometria, assicurati che le unità siano longitudine e latitudine. Alcuni set di dati pubblici utilizzano sistemi di coordinate diversi nelle intestazionix
ey
. Se vengono utilizzate unità errate, il set di dati potrebbe essere importato correttamente, ma i dati sottoposti a rendering possono mostrare i punti del set di dati in posizioni impreviste.