Подготовка

В этом документе описаны необходимые условия, лучшие практики и распространенные ошибки при работе с наборами данных.

Предварительные требования

При создании набора данных:

  • Отображаемые имена должны быть уникальными в рамках вашего проекта Google Cloud.
  • Имена отображаемых символов должны быть меньше 64 байт (поскольку эти символы представлены в UTF-8, в некоторых языках каждый символ может быть представлен несколькими байтами).
  • Описание должно быть меньше 1000 байт.

При загрузке данных:

  • Поддерживаются следующие типы файлов: CSV, GeoJSON и KML.
  • Максимально допустимый размер файла составляет 500 МБ.
  • Названия столбцов атрибутов не могут начинаться со строки "?_".
  • Трехмерные геометрические объекты не поддерживаются. Это включает в себя суффикс "Z" в формате WKT и координаты высоты в формате GeoJSON.

лучшие практики подготовки данных

Если ваши исходные данные сложны или объемны, например, содержат большое количество точек, длинные линии или полигоны (часто к этой категории относятся файлы размером более 50 МБ), рекомендуется упростить данные перед загрузкой, чтобы добиться наилучшей производительности при визуализации карты.

Вот несколько рекомендаций по подготовке данных:

  1. Сведите к минимуму свойства объектов . Оставляйте только те свойства объектов, которые необходимы для оформления карты, например, «id» и «category». Вы можете привязать дополнительные свойства к объекту в клиентском приложении, используя стили, управляемые данными, на основе уникального идентификатора. Например, см. раздел «Просмотр данных в реальном времени с помощью стилей, управляемых данными» .
  2. По возможности используйте простые типы данных для объектов свойств, например целые числа, чтобы минимизировать размер тайлов и повысить производительность карты.
  3. Перед загрузкой файла упростите сложные геометрические объекты . Это можно сделать в любом геопространственном инструменте, например, в утилите с открытым исходным кодом Mapshaper.org , или в BigQuery, используя функцию ST_Simplify для сложных полигональных объектов.
  4. Перед загрузкой файла выполните кластеризацию очень плотных точек . Это можно сделать в любом геопространственном инструменте, например, с помощью функций кластеризации turf.js с открытым исходным кодом, или в BigQuery, используя функцию ST_CLUSTERDBSCAN для плотных точечных геометрических объектов.

Дополнительные рекомендации по передовым методам работы с наборами данных см. в разделе «Визуализация данных с помощью наборов данных и BigQuery» .

Требования GeoJSON

API картографических наборов данных поддерживает текущую спецификацию GeoJSON . API картографических наборов данных также поддерживает файлы GeoJSON, содержащие любой из следующих типов объектов:

  • Геометрические объекты . Геометрический объект — это пространственная фигура, описываемая как объединение точек, линий и многоугольников с возможными отверстиями.
  • Объекты объектов . Объект объекта содержит геометрические данные, а также дополнительные пары «имя/значение», смысл которых зависит от конкретного приложения.
  • Наборы признаков . Набор признаков — это совокупность объектов признаков.

API картографических наборов данных не поддерживает файлы GeoJSON, содержащие данные в системе координат, отличной от WGS84 .

Для получения дополнительной информации о GeoJSON см. раздел «Соответствие RFC 7946» .

Требования KML

API для работы с наборами данных карт предъявляет следующие требования:

  • Все URL-адреса должны быть локальными (или относительными) по отношению к самому файлу.
  • Поддерживаются точечные, линейные и многоугольные геометрические объекты.
  • Все атрибуты данных рассматриваются как строки.
Следующие функции KML не поддерживаются:
  • Значки или <styleUrl> , определенные вне файла.
  • Сетевые ссылки, например, <NetworkLink>
  • Наложения на грунт, такие как <GroundOverlay>
  • 3D-геометрии или любые теги, связанные с высотой, например, <altitudeMode>
  • Технические характеристики камеры, такие как <LookAt>
  • Стили определены внутри KML-файла.

Требования к CSV

Для CSV-файлов поддерживаемые имена столбцов перечислены ниже в порядке приоритета:

  • latitude , longitude
  • lat , long
  • x , y
  • wkt (известный текст)
  • address , city , state , zip
  • address
  • Один столбец, содержащий всю адресную информацию, например: 1600 Amphitheatre Parkway Mountain View, CA 94043

Например, ваш файл содержит столбцы с именами x , y и wkt . Поскольку столбцы x и y имеют более высокий приоритет, определяемый порядком поддерживаемых имен столбцов в приведенном выше списке, используются значения из столбцов x и y , а столбец wkt игнорируется.

Кроме того:

  • Каждое имя столбца должно принадлежать одному столбцу. То есть, не может быть столбца с именем xy , содержащего данные как по координатам x, так и по координатам y. Координаты x и y должны находиться в отдельных столбцах.
  • Названия столбцов нечувствительны к регистру.
  • Порядок названий столбцов не имеет значения. Например, если ваш CSV-файл содержит столбцы lat и long , они могут располагаться в любом порядке.

Обработка ошибок при загрузке данных

При загрузке данных в набор данных вы можете столкнуться с одной из распространенных ошибок, описанных в этом разделе.

Ошибки GeoJSON

К распространённым ошибкам GeoJSON относятся:

  • Отсутствует поле type , или type не является строкой. Загруженный файл данных GeoJSON должен содержать строковое поле с именем type в рамках определения каждого объекта Feature и объекта Geometry.

Ошибки KML

К распространённым ошибкам KML относятся:

  • Файл данных не должен содержать ни одной из перечисленных выше неподдерживаемых функций KML, иначе импорт данных может завершиться неудачей.

ошибки CSV

К распространённым ошибкам в CSV-файлах относятся:

  • В некоторых строках столбца «Геометрия» отсутствуют значения. Все строки в CSV-файле должны содержать непустые значения в столбце «Геометрия». К столбцам «Геометрия» относятся:
    • latitude , longitude
    • lat , long
    • x , y
    • wkt
    • address , city , state , zip
    • address
    • Один столбец, содержащий всю адресную информацию, например: 1600 Amphitheatre Parkway Mountain View, CA 94043
  • Если x и y — это столбцы с геометрическими данными, убедитесь, что единицы измерения — долгота и широта. В некоторых общедоступных наборах данных используются разные системы координат в заголовках x и y . Если используются неправильные единицы измерения, набор данных может быть успешно импортирован, но отображаемые данные могут показывать точки набора данных в неожиданных местах.