การแปลงข้อมูลตัวเลข

คุณอาจต้องใช้การเปลี่ยนรูปแบบ 2 ประเภทกับข้อมูลตัวเลข ดังนี้

  • การทําให้เป็นมาตรฐาน - เปลี่ยนรูปแบบข้อมูลตัวเลขเป็นระดับเดียวกับข้อมูลตัวเลขอื่นๆ
  • ที่เก็บข้อมูล - การแปลงข้อมูลตัวเลข (มักจะต่อเนื่องกัน) เป็นข้อมูลเชิงหมวดหมู่

ทําไมจึงต้องทําให้ฟีเจอร์ตัวเลขเป็นมาตรฐาน

เราขอแนะนําให้สร้างมาตรฐานสําหรับชุดข้อมูลที่มีฟีเจอร์ตัวเลขซึ่งครอบคลุมช่วงที่ต่างกันอย่างชัดเจน (เช่น อายุและรายได้) เมื่อช่วงที่ต่างกันมีช่วงที่ต่างกัน การไล่ระดับแบบไล่ระดับสีจะ &โควตานขึ้น&ตีกลับ และชะลอการบรรจบลงได้ เครื่องมือเพิ่มประสิทธิภาพ เช่น Adagrad และ Adam ป้องกันปัญหานี้ได้ด้วยการสร้างอัตราการเรียนรู้ที่มีประสิทธิภาพแยกกันสําหรับแต่ละฟีเจอร์

นอกจากนี้ เรายังแนะนําให้ปรับฟีเจอร์ตัวเลขเดียวให้ครอบคลุมทั่วไป เช่น {0}quot;city ประชากร&" ถ้าไม่ทําฟีเจอร์ต่างๆ ให้เป็นมาตรฐาน "city " การฝึกโมเดลอาจสร้างข้อผิดพลาด NaN อย่างไรก็ตาม เครื่องมือเพิ่มประสิทธิภาพอย่าง Adagrad และ Adam ป้องกันข้อผิดพลาด NaN ไม่ได้ เมื่อมีค่าที่หลากหลายในฟีเจอร์เดียว