إذا كنت جديدًا على Freebase، يغطّي هذا القسم المصطلحات والمفاهيم الأساسية اللازمة لفهم طريقة عمل Freebase.
- الرسومات البيانية
- المواضيع
- الأنواع والسمات
- النطاقات وأرقام التعريف
- أنواع القيم المركّبة
- معرّفات MID الخاصة بالمواضيع
- مساحات الأسماء والمفاتيح وأرقام تعريف المواضيع
- مزيد من المعلومات عن المواقع
- ملخّص
المخططات
يتم تخزين بيانات Freebase في هيكل بيانات يُعرف باسم الرسم البياني. يتكوّن الرسم البياني من عُقد مرتبطة بحواف. في Freebase، يتم تحديد العُقد باستخدام /type/object ويتم تحديد الحواف باستخدام /type/link. من خلال تخزين البيانات كرسومات بيانية، يمكن لـ Freebase التنقّل بسرعة بين الروابط العشوائية بين المواضيع وإضافة مخططات جديدة بسهولة بدون الحاجة إلى تغيير بنية البيانات.
المواضيع
يحتوي Freebase على أكثر من 39 مليون موضوع حول كيانات من العالم الحقيقي، مثل الأشخاص والأماكن والأشياء. بما أنّ بيانات Freebase ممثّلة في رسم بياني، تتوافق هذه المواضيع مع العُقد في الرسم البياني. ومع ذلك، ليس كل عقدة موضوعًا. يمكنك الاطّلاع على قسم التقنيات التي تحسّن تجربة المشاهدة كمثال على العُقد التي ليست مواضيع.
في ما يلي أمثلة على أنواع المواضيع التي يتم العثور عليها في Freebase:
- الكيانات المادية، مثل بوب ديلان ومتحف اللوفر وكوكب زحل
- الابتكارات الفنية أو الإعلامية، مثل The Dark Knight (فيلم) وHotel California (أغنية)
- التصنيفات، مثل غاز نبيل أو حبليات
- المفاهيم المجردة، مثل الحب، إلى
- المدارس الفكرية أو الحركات الفنية، مثل الانطباعية:
بعض المواضيع جديرة بالملاحظة لأنّها تتضمّن الكثير من البيانات (مثل وول مارت)، وبعضها بارز لأنّه يرتبط بالعديد من المواضيع الأخرى، ربما في مجالات مختلفة من المعلومات. على سبيل المثال، لا تتضمّن المواضيع المجردة، مثل الحب والفقر والفروسية وما إلى ذلك، العديد من السمات المرتبطة بها، ولكنها تظهر غالبًا كمواضيع للكتب والشعر والأفلام وما إلى ذلك، ما يجعلها أكثر أهمية.
الأنواع والخصائص
يمكن الاطّلاع على أي موضوع من وجهات نظر مختلفة، مثلاً:
- كان "بوب ديلن" مؤلف أغاني ومغنيًا وفنانًا ومؤلف كتب وممثلاً سينمائيًا.
- كان ليوناردو دا فينشي رسامًا ونحاتًا وعالم تشريح ومهندسًا معماريًا ومهندسًا و...
- الحب هو موضوع كتاب أو فيلم أو مسرحية أو قصيدة أو غير ذلك.
- أي مدينة هي موقع جغرافي، وربما وجهة سياحية، وصاحب عمل للموظفين المدنيين.
من أجل استيعاب الطبيعة المتعددة الجوانب للعديد من المواضيع، نقدّم مفهوم الأنواع في Freebase. يمكن أن تتضمّن المواضيع في Freebase أي عدد من الأنواع المخصّصة لها. يتم تعيين عدة أنواع للموضوع حول بوب ديلان، مثل نوع كاتب الأغاني ونوع مؤلف الموسيقى ونوع الفنان الموسيقي (المغني) ونوع مؤلف الكتب وما إلى ذلك. ويتضمّن كل نوع مجموعة مختلفة من الخصائص ذات الصلة بهذا النوع. على سبيل المثال:
- يتضمّن نوع الفنّان الموسيقي سمة تسرد كل الألبومات التي أنتجها "بوب ديلن" وكل الآلات الموسيقية التي كان يعزف عليها.
- يحتوي نوع مؤلف الكتاب على خاصية تسرد جميع الكتب التي كتبها أو حرّرها بوب ديلان، بالإضافة إلى أسلوبه الأدبي أو حركته الأدبية.
- يحتوي نوع الشركة على العديد من الخصائص لإدراج مؤسسي الشركة وأعضاء مجلس إدارتها والشركة الأم والأقسام والموظفين والمنتجات وسجلات الإيرادات والأرباح السنوية وما إلى ذلك.
وبالتالي، يمكن اعتبار النوع حاوية مفاهيمية للسمات التي نحتاج إليها عادةً لوصف جانب معيّن من المعلومات. (يمكنك اعتبار النوع مشابهًا لجدول علائقي، ويحتوي كل جدول "نوع" على مفتاح خارجي في جدول "المعرّف" الذي يحدّد كل موضوع بشكل فريد).
النطاقات والمعرّفات
وكما يتم تجميع المواقع في أنواع، يتم تجميع الأنواع نفسها في نطاقات. يمكن اعتبار النطاقات بمثابة الأقسام في جريدتك المفضّلة: الأعمال، وأسلوب الحياة، والفنون والترفيه، والسياسة، والاقتصاد، وما إلى ذلك. ويتم منح كل نطاق معرّفًا، مثلاً:
-
/business
هو معرّف نطاق النشاط التجاري -
/music
: نطاق الموسيقى -
/film
: نطاق الأفلام -
/medicine
- نطاق الطب
يبدو معرّف النطاق مثل مسار ملف أو مسار في عنوان ويب.
يتم أيضًا منح كل نوع معرّفًا، ويستند المعرّف إلى النطاق الذي ينتمي إليه. على سبيل المثال، ينتمي نوع الشركة إلى نطاق الأنشطة التجارية، ويتم منحه المعرّف /business/company
. في ما يلي بعض الأمثلة الأخرى:
-
/music/album
هو رقم تعريف نوع الألبوم (الموسيقي) الذي ينتمي إلى نطاق الموسيقى -
/film/actor
- نوع الممثل في مجال الأفلام -
/medicine/disease
: نوع المرض في مجال الطب
وكما يرث النوع بداية معرّفه من نطاقه، يرث العنصر أيضًا بداية معرّفه من النوع الذي ينتمي إليه. على سبيل المثال، تم منح المعرّف /business/company/industry
للسمة "مجال العمل" من النوع "شركة" (المستخدَمة لتحديد مجال عمل الشركة). في ما يلي بعض الأمثلة الأخرى:
-
/automotive/engine/horsepower
هو رقم تعريف السمة "القدرة الحصانية" لنوع المحرّك (الخاص بالسيارات) -
/astronomy/star/planet_s
هو معرّف السمة "الكواكب" من النوع "نجم" (يُستخدم لإدراج الكواكب حول نجم) -
/language/human_language/writing_system
هو رقم تعريف السمة "نظام الكتابة" من النوع "لغة بشرية"
وبالتالي، على الرغم من أنّ الأنواع غير مرتّبة في تسلسلات هرمية في Freebase، يتم منح النطاقات والأنواع والسمات معرّفات مرتّبة بشكل مفهوم في تسلسل هرمي يشبه دليل الملفات.
أنواع القيم المركّبة
نوع القيمة المركّبة هو نوع ضمن Freebase يُستخدم لتمثيل البيانات التي يتكوّن كل إدخال فيها من حقول متعدّدة. تُستخدم أنواع القيم المركّبة، أو CVT، في Freebase لتمثيل البيانات المعقّدة. قد يكون الأمر مربكًا بعض الشيء في البداية، ولكنّ أنواع البيانات المركّبة هي جزء مهم جدًا من مخطط Freebase وتسمح له بنمذجة العلاقات المعقّدة بين المواضيع بدقة أكبر.
لنأخذ المثال التالي: عدد سكان المدينة هو قيمة تتغيّر بمرور الوقت. وهذا يعني أنّه كلما طلبت معلومات عن عدد السكان من Freebase، فإنّك تطلب ضِمنيًا على الأقل معلومات عن عدد السكان في تاريخ معيّن. يتضمّن ذلك قيمتين، وهما عدد الأشخاص والتاريخ. إليك حالة يصبح فيها ناقل الحركة المتغيّر باستمرار مفيدًا للغاية. بدون ذلك، ولعرض بيانات السكان، عليك إنشاء موضوع وتسميته مثلاً "عدد سكان فانكوفر في عام 1997"، ثم إرسال المعلومات إليه.
يمكن اعتبار CVT موضوعًا لا يتطلّب منك إنشاء اسم معروض. تحتوي المواضيع المخصّصة على معرّف فريد عالميًا (GUID) يمكن الرجوع إليه بشكل مستقل، تمامًا مثل المواضيع العادية. ومع ذلك، يعامل عميل Freebase هذه الكلمات بشكل مختلف تمامًا عن المواضيع. في معظم الحالات، يجب أن تكون كل خاصية من خصائص CVT خاصية لإزالة الغموض.
معرّفات MID الخاصة بالمواضيع
على الرغم من أنّ الموضوع قد يكون قابلاً أو غير قابل للتحديد من خلال معرّفات مساحة الاسم/المفتاح، يمكن دائمًا تحديده باستخدام معرّف آلي (MID) يتألف من /m/
متبوعًا بمعرّف فريد بنظام العد 32. يتم تعيين أرقام تعريف وسيطة للمواضيع عند إنشائها، وتتم إدارتها طوال مدة توفّر الموضوع. وتلعب هذه المعرّفات دورًا مهمًا عند دمج المواضيع أو تقسيمها، ما يسمح للتطبيقات الخارجية بتتبُّع الموضوع المنطقي حتى إذا تغيّرت هوية Freebase المادية (المعرّف الفريد العام للموضوع). تختلف المعرّفات التي يتم إنشاؤها آليًا عن معرّفات Freebase الأخرى التي يمكن لشخص عادي قراءتها (التي تعرضها السمة "id") في ما يلي:
- مضمون الوجود
- تم إنشاؤها بطريقة آلية
- مصمَّم لإجراء مقارنة بلا إنترنت
- غير مصمَّمة لنقل المعنى إلى البشر
- قصير (ربما يكون بطول ثابت)
- مثالية لتبادل المفاتيح بسرعة بين الأنظمة والمكوّنات الخارجية (خارجية، تبادل)
المعرّفات الآلية هي المعرّف المقترَح استخدامه للإشارة إلى المواضيع في Freebase
مساحات الأسماء والمفاتيح وأرقام تعريف المواضيع
إنّ التسلسل الهرمي المشابه لدليل الملفات والذي يتضمّن معرّفات النطاق والنوع والخاصية هو مجرّد تطبيق لمفهوم أكثر عمومية: مساحات الأسماء والمفاتيح. مساحة الاسم تشبه دليل الملفات، والمفتاح يشبه اسم الملف. وكما يجب أن تكون جميع أسماء الملفات ضمن دليل ملف معيّن فريدة من نوعها، يجب أيضًا أن تكون جميع المفاتيح ضمن مساحة اسم معيّنة فريدة من نوعها.
كمثال أكثر تحديدًا، /business
هو مساحة الاسم المقابلة لنطاق "النشاط التجاري". ضمن هذا النوع، يتم منح الأنواع ذات الصلة بالأنشطة التجارية مفاتيح (مثل company
) التي تكون فريدة من نوعها. يتم إنشاء رقم تعريف كل نوع من خلال إضافة مفتاحه إلى رقم تعريف مساحة الاسم (على سبيل المثال، /business/company
).
هناك عدة أنواع من مساحات الأسماء إلى جانب مساحات الأسماء التي تتوافق مع النطاقات والأنواع. الأكثر أهمية والأكثر شيوعًا هو مساحة الاسم /en
. هذه هي مساحة الاسم الإنجليزية التي يمكن فيها منح معظم المواضيع المعروفة مفاتيح فريدة لتكوين معرّفات إنجليزية يمكن قراءتها. على سبيل المثال، إنّ "بوب ديلان" هو شخصية معروفة جدًا، لذا تم منح موضوعه في Freebase المفتاح bob_dylan
في مساحة الاسم /en
، وبالتالي يكون معرّف الموضوع هو /en/bob_dylan
. يتيح لك هذا المعرّف الوصول إلى موضوعه في تطبيق الويب باستخدام عنوان URL بسيط.
مزيد من المعلومات حول "الأماكن للاستئجار"
آخر مفهوم أساسي يجب مناقشته يتضمّن فرقًا كبيرًا بين سمات Freebase وما يقابلها في تكنولوجيات قواعد البيانات العلائقية، أي أعمدة الجداول العلائقية. بالنسبة إلى كل صف، يمكن أن يحتوي عمود الجدول العلائقي على قيمة واحدة فقط. على سبيل المثال، لنفترض أنّ لديك جدولاً علائقيًا نموذجيًا "للكتب" يتضمّن عمودًا باسم "المؤلف". بالنسبة إلى كل صف في جدول "الكتاب"، يمكن أن يحتوي عمود "المؤلف" على مفتاح خارجي واحد فقط إلى جدول "المؤلف". إذا كان الكتاب يتضمّن عدة مؤلفين، لن ينجح تصميم مخطط قاعدة البيانات الارتباطية البسيط هذا، وسيكون علينا إنشاء جدول جديد لتصميم عمليات التأليف. أي أنّنا سنحتاج إلى جدول "كتب" وجدول "مؤلف" وجدول "تأليف" لتخزين العلاقات المتعددة بين الكتب والمؤلفين. وتتغير طريقة استرداد البيانات بشكل جذري عند التبديل من تصميم مخطط إلى آخر.
على عكس تكنولوجيات قواعد البيانات التقليدية، تعتبر Freebase الخصائص المتعددة القيم مرغوبة جدًا في تصميم بيانات من الحياة الواقعية، لذا فهي تتيح الخصائص المتعددة القيم تلقائيًا. أي أنّه عند إنشاء السمة /book/written_work/author
، تم افتراض أنّها تسمح بتحديد مؤلفين متعددين لكل كتاب، ويمكنك البحث عن سمة متعددة القيم وسمة أحادية القيمة بالطريقة نفسها تمامًا. ليست هناك حاجة للتفكير في ما إذا كنت بحاجة إلى الانضمام إلى جدول ثالث يمثّل العلاقة بين n وn.
ملخّص
- النوع هو حاوية مفاهيمية للخصائص ذات الصلة التي نحتاج إليها عادةً لوصف جانب معيّن من موضوع ما.
- يمكن تعيين نوع واحد أو أكثر لموضوع ما (النوع التلقائي هو
/common/topic
) - وبما أنّ المواقع يتم تجميعها في أنواع، يتم تجميع الأنواع في نطاقات.
- يتم منح النطاقات والأنواع والخصائص أرقام تعريف في تسلسل هرمي للمساحة الاسمية/المفتاح.
- يتم منح المواضيع الشائعة والمعروفة معرّفات في مساحة الاسم
/en
، وهي سلاسل باللغة الإنجليزية يمكن لشخص عادي قراءتها. - يتم تحديد المواضيع بشكل فريد ضمن Freebase من خلال المعرّفات الفريدة العمومية (GUID).
- تكون السمات متعدّدة القيم تلقائيًا، ويمكن طلب البحث عن السمات المتعدّدة القيم والسمات الأحادية القيم بالطريقة نفسها.