تحويل البيانات الرقمية

قد تحتاج إلى تطبيق نوعين من الإحالات الناجحة على البيانات الرقمية:

  • التسوية - تحويل البيانات الرقمية إلى المقياس نفسه للبيانات الرقمية الأخرى.
  • مجموعة البيانات - تحويل البيانات الرقمية (المستمرة عادةً) إلى بيانات تصنيفية.

ما رأيك في تطبيع الميزات الرقمية؟

ننصحك بشدة بتسوية مجموعة بيانات تتضمّن ميزات رقمية تغطي نطاقات مختلفة بشكل واضح (على سبيل المثال، العمر والدخل). عندما تحتوي الميزات المختلفة على نطاقات مختلفة، يمكن أن يؤدي "الانحدار" إلى "b;;ارتداد&quot؛ وإبطاء وتيرة التباعد. تحمي أدوات تحسين الأداء مثل Adagrad وAdam من هذه المشكلة عن طريق إنشاء معدل تعلّم فعّال منفصل لكل ميزة.

وننصح أيضًا بتسوية ميزة رقمية واحدة تغطي نطاقًا واسعًا، مثل "&&;; تعداد المدن" إذا لم تطبِّق ميزة &"المدن والمدينة" قد يؤدي تدريب النموذج إلى حدوث أخطاء في NaN. للأسف، لا يمكن لأدوات تحسين الأداء، مثل Adagrad وآدم، منع حدوث أخطاء NaN عند وجود مجموعة واسعة من القيم ضمن ميزة واحدة.