انواع داده ها و انواع معنایی

هنگامی که یک اتصال دهنده جامعه می سازید، هر فیلدی که در طرح تعریف می کنید به یک نوع داده نیاز دارد. نوع داده نوع ابتدایی فیلد مانند BOOLEAN ، STRING ، NUMBER و غیره را تعریف می کند.

علاوه بر انواع داده ها، Looker Studio از انواع معنایی نیز استفاده می کند. انواع معنایی به توصیف نوع اطلاعاتی که داده ها نشان می دهند کمک می کند. به عنوان مثال، یک فیلد با نوع داده NUMBER ممکن است از نظر معنایی مقدار یا درصد ارز را نشان دهد و یک فیلد با نوع داده STRING ممکن است از نظر معنایی یک شهر را نشان دهد. برای مشاهده اینکه کدام نوع معنایی در دسترس است، لطفاً به اسناد انواع معنایی مراجعه کنید

فیلدهای طرحواره Connector Community و Looker Studio

هنگامی که شما طرحی را برای رابط جامعه خود تعریف می کنید، ویژگی های مختلفی برای هر فیلد وجود دارد که نحوه نمایش و استفاده فیلد در استودیو Looker را تعیین می کند. مثلا:

  • ConceptType در شمای رابط شما با استفاده از ویژگی conceptType تعریف شده است. این ویژگی تعیین می کند که آیا فیلد به عنوان یک بعد یا متریک در نظر گرفته می شود. توضیحی در مورد تفاوت بین معیارها و ابعاد را می توان در Dimensions and Metrics یافت.
  • نوع معنایی را می توان در طرح کانکتور تعریف کرد یا می تواند به طور خودکار توسط Looker Studio بر اساس ویژگی نوع داده تعریف شده در کانکتور شما و مقادیر داده ای که توسط کانکتور شما برگردانده شده است، شناسایی کند. برای جزئیات نحوه عملکرد، به تشخیص خودکار نوع معنایی مراجعه کنید.
  • نوع تجمع تعیین می کند که آیا مقادیر متریک (ابعاد نادیده گرفته می شوند) می توانند دوباره جمع شوند. تنظیم ویژگی semantics.isReaggregatable روی true به صورت پیش‌فرض روی تجمع SUM خواهد بود، در غیر این صورت روی Auto تنظیم می‌شود. همچنین می توانید به صورت دستی نوع تجمیع پیش فرض را برای فیلدهای قابل جمع آوری مجدد با استفاده از ویژگی defaultAggregationType تنظیم کنید.

هنگامی که با استفاده از یک رابط در استودیو Looker پیکربندی و متصل می‌شوید، ویرایشگر فیلدها، طرح کامل رابط را بر اساس نحوه تعریف ویژگی‌های بالا نشان می‌دهد. اگر انواع معنایی را وارد کرده باشید، آن‌طور که شما تعریف کرده‌اید نشان داده می‌شوند. اگر از تشخیص خودکار نوع معنایی استفاده می کنید، فیلدها همانطور که شناسایی شده اند نشان داده می شوند. صفحه نمایش فیلدها

تنظیم اطلاعات معنایی

دو راه برای تنظیم اطلاعات معنایی وجود دارد. شما می توانید معنای فیلد را به صورت دستی تنظیم کنید یا برای شناسایی خودکار به Looker Studio تکیه کنید.

به عنوان مثال، اگر عددی دارید که از نظر معنایی دلار آمریکا را نشان می‌دهد، استودیوی Looker قادر به تشخیص خودکار این نوع معنایی نخواهد بود. علاوه بر این، تشخیص معنایی خودکار به استودیوی Looker نیاز دارد تا برای هر قسمت از طرح شما تماس‌های واکشی داده‌ها را برقرار کند. اگر به جای آن طرح را به صورت دستی مشخص کنید، هیچ تماسی برای واکشی داده برقرار نخواهد شد. در صورتی که نوع معنایی (مثلاً واحد پول، درصد، تاریخ و غیره) را برای داده‌های خود می‌دانید، توصیه می‌کنیم به صراحت این را در طرحواره به دلایل دقت و عملکرد تنظیم کنید.

تنظیم دستی انواع معنایی (توصیه می شود)

اگر انواع معنایی خود را می‌شناسید، می‌توانید به صورت دستی برای هر فیلد طرحواره semantics تعریف کنید. جزئیات کامل در مورد ویژگی هایی که در دسترس شما هستند را می توانید در صفحه مرجع فیلد پیدا کنید. اگر می خواهید انواع معنایی دستی را تعریف کنید، توصیه می شود که semanticType و semanticGroup برای هر فیلد تعریف کنید. با ارائه دستی این ویژگی ها، فرآیند تشخیص نوع معنایی خودکار اجرا نمی شود. اگر برخی از فیلدهای خود را به صورت دستی تنظیم کنید، اما نه همه، آنهایی که به طور پیش‌فرض روی Text ، Number یا Boolean تعیین نمی‌کنید، بسته به dataType تعیین‌شده برای فیلد.

در زیر نمونه ای از یک طرحواره ساده است که به صورت دستی انواع معنایی را تنظیم می کند. Income به عنوان ارز و Filing Year به عنوان یک تاریخ تعیین می شود.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

عیب یابی دستی انواع معنایی

اگر انواع معنایی خود را به اشتباه برای داده های زیرین تنظیم کنید، آنها به درستی کار نخواهند کرد. آزمایش این می تواند دشوار باشد، اما چند کار وجود دارد که می توانید برای کمک به یافتن مشکلات انجام دهید.

  1. 2 یا 3 ردیف از داده های خود را به جای همه آنها برگردانید، سپس به صورت دستی آن را بررسی کنید.
  2. در استودیو Looker جدولی درست کنید که فقط از فیلدی که می‌خواهید بررسی کنید استفاده می‌کند.
  3. به فیلدهای Geo و Date توجه زیادی داشته باشید زیرا سخت‌ترین فرمت را دارند.

تشخیص خودکار نوع معنایی

اگر هیچ نوع معنایی را در طرحواره خود تعریف نکرده‌اید، استودیوی Looker سعی می‌کند به طور خودکار آنها را بر اساس ویژگی نوع داده و قالب مقادیر داده‌ای که توسط رابط شما برگردانده شده است شناسایی کند.

مراحل فرآیند تشخیص خودکار به شرح زیر است:

  1. با اجرای تابع getSchema کانکتور جامعه خود، طرح را درخواست کنید.
  2. از طریق دسته‌ای از فیلدهای تعریف شده در طرح اتصال تکرار کنید و فیلدها را درخواست getData صادر کنید. درخواست‌های getData با پارامتر sampleExtraction که روی true تنظیم شده است اجرا می‌شوند تا نشان دهد درخواست‌های داده برای اهداف تشخیص معنایی هستند.
  3. بر اساس نوع داده فیلد و فرمت مقدار بازگشتی از درخواست getData ، نوع معنایی فیلد را شناسایی کنید.

گزینه هایی برای تشخیص خودکار نوع معنایی

هنگامی که Looker Studio تابع getData یک اتصال دهنده جامعه را به منظور تشخیص معنایی اجرا می کند، درخواست ورودی حاوی یک ویژگی sampleExtraction است که روی true تنظیم می شود. داده های برگردانده شده توسط رابط شما فقط توسط Looker Studio برای شناسایی نوع معنایی فیلد استفاده می شود. از آنجایی که مقدار برای هیچ هدف دیگری استفاده نخواهد شد، به داده های واقعی از منبع خارجی شما نیاز ندارد.

چندین راه برای بهبود تشخیص نوع معنایی در کد شما وجود دارد:

  • توصیه می شود: مقادیر از پیش تعریف شده را پاس کنید
    یک مقدار از پیش تعریف شده برای هر فیلد برگردانید که بهترین نوع معنایی فیلد را نشان می دهد و به درستی توسط Looker Studio تشخیص داده می شود. به عنوان مثال، اگر نوع معنایی یک فیلد Country است، مقداری مانند IT برای ایتالیا برگردانید. مزیت دیگر این روش این است که بسیار سریعتر است زیرا نیازی به درخواست HTTP برای داده ها به سرویس شخص ثالث ندارد.

  • فقط n تعداد رکورد را برگردانید
    اگر سرویس شخص ثالثی که داده‌ها را از آن واکشی می‌کنید، از محدودیت‌های ردیف در هنگام درخواست داده پشتیبانی می‌کند، به جای مجموعه داده کامل، زیرمجموعه کوچکی از ردیف‌ها را به Looker Studio برگردانید. این مقدار داده‌هایی را که باید برای هر درخواست تشخیص معنایی به استودیوی Looker ارسال کنید، محدود می‌کند.

  • تمام ستون ها را درخواست کنید و پاسخ را در حافظه پنهان ذخیره کنید
    اگر امکان درخواست تمام ستون‌ها برای سرویس شخص ثالثی که داده‌ها را از آن دریافت می‌کنید وجود دارد، در اولین درخواست تشخیص معنایی دریافتی از استودیو Looker، همه ستون‌ها را واکشی کنید و نتایج را در حافظه پنهان ذخیره کنید. برای درخواست‌های تشخیص معنایی بعدی، به جای درخواست‌های HTTP اضافی به سرویس شخص ثالث، مقادیر ستون‌ها را از حافظه پنهان واکشی کنید.

  • هیچ کار متفاوتی انجام نده
    شما می توانید انتخاب کنید که برای درخواست هایی که sampleExtraction روی true تنظیم شده است، هیچ گونه تطبیق خاصی را اجرا نکنید. این باعث می شود که فرآیند Semantic Detection کندتر شود زیرا Looker Studio باید تمام داده ها را برای فرآیند Semantic Detection واکشی کند. علاوه بر این، این روی نرخ درخواست به منبع داده خارجی شما تأثیر می گذارد زیرا بسیاری از درخواست های تشخیص معنایی به صورت موازی اجرا می شوند.

فرمت های شناخته شده برای تشخیص خودکار نوع معنایی

زمان قرار
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • زمان: دوره برای ثانیه، میکرو، میلی و نانو.
جغرافیایی