В этом документе описаны необходимые условия, лучшие практики и распространенные ошибки при работе с наборами данных.
Предварительные требования
При создании набора данных:
- Отображаемые имена должны быть уникальными в рамках вашего проекта Google Cloud.
- Имена отображаемых символов должны быть меньше 64 байт (поскольку эти символы представлены в UTF-8, в некоторых языках каждый символ может быть представлен несколькими байтами).
- Описание должно быть меньше 1000 байт.
При загрузке данных:
- Поддерживаются следующие типы файлов: CSV, GeoJSON и KML.
- Максимально допустимый размер файла составляет 500 МБ.
- Названия столбцов атрибутов не могут начинаться со строки "?_".
- Трехмерные геометрические объекты не поддерживаются. Это включает в себя суффикс "Z" в формате WKT и координаты высоты в формате GeoJSON.
лучшие практики подготовки данных
Если ваши исходные данные сложны или объемны, например, содержат большое количество точек, длинные линии или полигоны (часто к этой категории относятся файлы размером более 50 МБ), рекомендуется упростить данные перед загрузкой, чтобы добиться наилучшей производительности при визуализации карты.
Вот несколько рекомендаций по подготовке данных:
- Сведите к минимуму свойства объектов . Оставляйте только те свойства объектов, которые необходимы для оформления карты, например, «id» и «category». Вы можете привязать дополнительные свойства к объекту в клиентском приложении, используя стили, управляемые данными, на основе уникального идентификатора. Например, см. раздел «Просмотр данных в реальном времени с помощью стилей, управляемых данными» .
- По возможности используйте простые типы данных для объектов свойств, например целые числа, чтобы минимизировать размер тайлов и повысить производительность карты.
- Перед загрузкой файла упростите сложные геометрические объекты . Это можно сделать в любом геопространственном инструменте, например, в утилите с открытым исходным кодом Mapshaper.org , или в BigQuery, используя функцию ST_Simplify для сложных полигональных объектов.
- Перед загрузкой файла выполните кластеризацию очень плотных точек . Это можно сделать в любом геопространственном инструменте, например, с помощью функций кластеризации turf.js с открытым исходным кодом, или в BigQuery, используя функцию ST_CLUSTERDBSCAN для плотных точечных геометрических объектов.
Дополнительные рекомендации по передовым методам работы с наборами данных см. в разделе «Визуализация данных с помощью наборов данных и BigQuery» .
Требования GeoJSON
API картографических наборов данных поддерживает текущую спецификацию GeoJSON . API картографических наборов данных также поддерживает файлы GeoJSON, содержащие любой из следующих типов объектов:
- Геометрические объекты . Геометрический объект — это пространственная фигура, описываемая как объединение точек, линий и многоугольников с возможными отверстиями.
- Объекты объектов . Объект объекта содержит геометрические данные, а также дополнительные пары «имя/значение», смысл которых зависит от конкретного приложения.
- Наборы признаков . Набор признаков — это совокупность объектов признаков.
API картографических наборов данных не поддерживает файлы GeoJSON, содержащие данные в системе координат, отличной от WGS84 .
Для получения дополнительной информации о GeoJSON см. раздел «Соответствие RFC 7946» .
Требования KML
API для работы с наборами данных карт предъявляет следующие требования:
- Все URL-адреса должны быть локальными (или относительными) по отношению к самому файлу.
- Поддерживаются точечные, линейные и многоугольные геометрические объекты.
- Все атрибуты данных рассматриваются как строки.
- Значки или
<styleUrl>, определенные вне файла. - Сетевые ссылки, например,
<NetworkLink> - Наложения на грунт, такие как
<GroundOverlay> - 3D-геометрии или любые теги, связанные с высотой, например,
<altitudeMode> - Технические характеристики камеры, такие как
<LookAt> - Стили определены внутри KML-файла.
Требования к CSV
Для CSV-файлов поддерживаемые имена столбцов перечислены ниже в порядке приоритета:
-
latitude,longitude -
lat,long -
x,y -
wkt(известный текст) -
address,city,state,zip -
address - Один столбец, содержащий всю адресную информацию, например:
1600 Amphitheatre Parkway Mountain View, CA 94043
Например, ваш файл содержит столбцы с именами x , y и wkt . Поскольку столбцы x и y имеют более высокий приоритет, определяемый порядком поддерживаемых имен столбцов в приведенном выше списке, используются значения из столбцов x и y , а столбец wkt игнорируется.
Кроме того:
- Каждое имя столбца должно принадлежать одному столбцу. То есть, не может быть столбца с именем
xy, содержащего данные как по координатам x, так и по координатам y. Координаты x и y должны находиться в отдельных столбцах. - Названия столбцов нечувствительны к регистру.
- Порядок названий столбцов не имеет значения. Например, если ваш CSV-файл содержит столбцы
latиlong, они могут располагаться в любом порядке.
Обработка ошибок при загрузке данных
При загрузке данных в набор данных вы можете столкнуться с одной из распространенных ошибок, описанных в этом разделе.
Ошибки GeoJSON
К распространённым ошибкам GeoJSON относятся:
- Отсутствует поле
type, илиtypeне является строкой. Загруженный файл данных GeoJSON должен содержать строковое поле с именемtypeв рамках определения каждого объекта Feature и объекта Geometry.
Ошибки KML
К распространённым ошибкам KML относятся:
- Файл данных не должен содержать ни одной из перечисленных выше неподдерживаемых функций KML, иначе импорт данных может завершиться неудачей.
ошибки CSV
К распространённым ошибкам в CSV-файлах относятся:
- В некоторых строках столбца «Геометрия» отсутствуют значения. Все строки в CSV-файле должны содержать непустые значения в столбце «Геометрия». К столбцам «Геометрия» относятся:
-
latitude,longitude -
lat,long -
x,y -
wkt -
address,city,state,zip -
address - Один столбец, содержащий всю адресную информацию, например:
1600 Amphitheatre Parkway Mountain View, CA 94043
-
- Если
xиy— это столбцы с геометрическими данными, убедитесь, что единицы измерения — долгота и широта. В некоторых общедоступных наборах данных используются разные системы координат в заголовкахxиy. Если используются неправильные единицы измерения, набор данных может быть успешно импортирован, но отображаемые данные могут показывать точки набора данных в неожиданных местах.