Tipos de datos y tipos semánticos

Al crear un conector de la comunidad, cada uno de los campos que definas en el esquema necesitará un tipo de datos. El tipo de datos define el tipo primitivo del campo, por ejemplo, BOOLEAN, STRING, NUMBER, etc.

Además de los tipos de datos, Data Studio también utiliza tipos semánticos, los cuales permiten describir la clase de información que representan los datos. Por ejemplo, un campo que tenga el tipo de datos NUMBER, semánticamente podría representar un importe monetario o un porcentaje; un campo que tenga el tipo de datos STRING, semánticamente podría representar una ciudad. Para saber qué tipos de datos están disponibles, consulta la documentación sobre tipos semánticos.

Esquema del conector de la comunidad y campos de Data Studio

Al definir el esquema del conector de la comunidad, las distintas propiedades de cada campo permiten determinar cómo se representa y se utiliza en Data Studio. Por ejemplo:

  • El tipo de concepto se define en el esquema del conector mediante la propiedad conceptType. Esta propiedad determina si el campo se trata como una dimensión o una métrica. En Dimensiones y métricas encontrarás una explicación sobre estos dos elementos.
  • El tipo semántico se puede definir en el esquema del conector, pero Data Studio también puede detectarlo automáticamente en función de la propiedad de tipo de datos que hayas definido en el conector y de los valores de los datos que este devuelva. Consulta el apartado Detección automática de los tipos semánticos para saber cómo funciona este proceso.
  • El tipo de agregación determina si se pueden volver a añadir los valores de las métricas (las dimensiones se omiten). Si asignas el valor semantics.isReaggregatable a la propiedad true, se aplicará la agregación SUM de forma predeterminada. Si no, el valor asignado de forma predeterminada es Auto. También puedes definir el tipo de agregación manualmente en los campos a los que se pueden volver a añadir valores mediante la propiedad defaultAggregationType.

Cuando configuras los parámetros y conectas los datos mediante un conector en Data Studio, en el editor de campos se muestra el esquema completo del conector en función de cómo hayas definido las propiedades anteriores. Si has incluido los tipos semánticos, aparecerán tal y como los hayas definido. Si utilizas la detección automática de tipos semánticos, los campos se mostrarán en función de cómo se hayan detectado.Fields Screen

Configurar la información semántica

Hay dos formas de configurar la información semántica. Puedes ajustar los campos semánticos manualmente o dejar que Data Studio los detecte automáticamente.

Por ejemplo, si un número representa semánticamente dólares estadounidenses, Data Studio no podrá detectar este tipo semántico de forma automática. Además, para que la detección automática de tipos semánticos se lleve a cabo, Data Studio debe realizar llamadas de obtención de datos de cada uno de los campos que se incluyen en el esquema. Si especificas los campos del esquema de forma manual, estas llamadas no se realizarán. Si conoces los tipos semánticos (p. ej., moneda, porcentaje, fecha, etc.) de los datos, te recomendamos que los ajustes en el esquema por motivos de precisión y rendimiento.

Configurar los tipos semánticos manualmente (recomendado)

Si conoces los tipos semánticos, puedes definir manualmente los parámetros de semantics en cada uno de los campos del esquema. En la página de referencia de campos encontrarás la información detallada de todos los campos disponibles. Si decides ajustar los tipos semánticos de forma manual, te recomendamos que definas semanticType y semanticGroup en cada uno de los campos. Si configuras las propiedades de forma manual, el proceso de detección automática de tipos semánticos no se ejecutará. Si ajustas solo algunos de los campos manualmente, al resto se les asignará el valor predeterminado Text, Number o Boolean, en función de la propiedad dataType que tenga especificado el campo.

A continuación se incluye el ejemplo de un esquema simple en el que se han definido manualmente los tipos semánticos. Los tipos semánticos de moneda y fecha son Income y Filing Year, respectivamente.

data-studio/semantics.gs
 var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

Solucionar problemas con los tipos semánticos definidos manualmente

Si configuras incorrectamente los tipos semánticos de los datos subyacentes, no funcionarán correctamente. No es fácil encontrar el origen de los problemas mediante pruebas, pero puedes hacer lo siguiente:

  1. Muestra dos o tres filas de los datos en lugar de mostrarlos todos, y luego analízalos manualmente.
  2. Crea una tabla en Data Studio que solo incluya la fila que quieres revisar.
  3. Presta especial atención a los campos Geo y Date porque son los que tienen el formato más estricto.

Detección automática de los tipos semánticos

Si no has definido ningún tipo semántico en el esquema, Data Studio intentará detectarlos automáticamente en función de la propiedad dataType y el formato de los valores de los datos que devuelve el conector.

Estos son los pasos que se siguen en el proceso de detección automática:

  1. Solicitar el esquema ejecutando la función getSchema del conector de la comunidad.
  2. Repetir el proceso (por lotes) con los campos definidos en el esquema del conector y enviar solicitudes getData de los campos. Las solicitudes getData se ejecutan si el parámetro sampleExtraction tiene asignado el valor true; con este ajuste se indica que el objetivo de las solicitudes de datos es detectar automáticamente los tipos semánticos.
  3. Identificar los tipos semánticos de los campos en función del tipo de datos y del formato de los valores que haya devuelto la solicitud getData.

Opciones para gestionar la detección automática de los tipos semánticos

Cuando Data Studio ejecuta la función getData de un conector de la comunidad para llevar a cabo la detección de los tipos semánticos, la solicitud que se recibe incluirá la propiedad sampleExtraction con el valor true asignado. Data Studio solo utiliza los datos que devuelve el conector para identificar el tipo semántico del campo. Como el valor no se usará con ningún otro objetivo, no se necesitan datos reales de la fuente externa.

Hay varias formas de mejorar la detección de los tipos semánticos en el código:

  • Transferir valores predefinidos (opción recomendada)
    Devuelve un valor predefinido en cada campo que represente lo mejor posible el tipo semántico y que Data Studio pueda detectarlo correctamente. Por ejemplo, si el tipo semántico de un campo es País, devuelve el valor IT para representar Italia. La otra ventaja de este mecanismo es que es mucho más rápido porque no tienes que enviar solicitudes HTTP de los datos al servicio de terceros.

  • Devolver solo un número limitado de registros
    Si el servicio de terceros del que obtienes los datos admite límites de filas a la hora de solicitarlos, devuelve un subconjunto reducido de datos a Data Studio en lugar de devolverlos todos. De esta manera, se limitará la cantidad de datos que debes transferir a Data Studio por cada solicitud de detección de tipos semánticos.

  • Solicitar todas las columnas y almacenar en caché la respuesta
    Si el servicio de terceros del que obtienes los datos permite solicitar todas las columnas, en la primera solicitud de detección de tipos semánticos que recibas de Data Studio obtén todas las columnas y almacena en caché los resultados. En posteriores solicitudes de detección de tipos semánticos, obtén los valores de las columnas de la memoria caché en lugar de enviar solicitudes HTTP adicionales al servicio de terceros.

  • No cambiar el procedimiento
    Puedes no aplicar ningún requisito específico a las solicitudes en las que el parámetro sampleExtraction tiene asignado el valor true. En consecuencia, la detección automática de los tipos semánticos será más lenta porque Data Studio tendrá que obtener todos los datos para poder llevar a cabo el proceso. Además, el porcentaje de solicitudes que se envían a la fuente de datos externa se verá afectado, ya que muchas solicitudes de detección de los tipos semánticos se ejecutarán en paralelo.

Formatos admitidos para detectar automáticamente los tipos semánticos

Fecha y hora
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Tiempo: periodo de segundos, microsegundos, milisegundos y nanosegundos
Información geográfica