การฝัง: การแปลเป็นพื้นที่ที่มีระดับล่าง

คุณสามารถแก้ไขปัญหาหลักของข้อมูลอินพุตจํานวนน้อยด้วยการแมปข้อมูลระดับสูงกับพื้นที่ที่มีมิติข้อมูลน้อยลง

ดังที่เห็นในแบบฝึกหัดของภาพยนตร์ก่อนหน้านี้ แม้แต่พื้นที่เล็กๆ แบบหลายมิติก็ให้อิสระในการรวมรายการที่มีความคล้ายในทางอรรถศาสตร์เข้าด้วยกันและทําให้รายการที่ไม่เหมือนกันอยู่ห่างกัน ตําแหน่ง (ระยะทางและทิศทาง) ในพื้นที่เวกเตอร์ สามารถเข้ารหัสความหมายในการฝังได้ดี ตัวอย่างเช่น ภาพต่อไปนี้ของการฝังจริงจะแสดงความสัมพันธ์ทางเรขาคณิตที่บันทึกความสัมพันธ์เชิงความหมาย เช่น ความสัมพันธ์ระหว่างประเทศกับเมืองหลวง

ตัวอย่างการฝังคํา 3 คําที่แสดงถึงความสัมพันธ์ของคําในลักษณะเรขาคณิต ได้แก่ เพศ (ชาย/หญิง และ ราชา/ราชินี) กริยาแสดงเวลาในการเดิน (เดิน/เดิน และว่ายน้ํา/ว่ายน้ํา) และเมืองหลวง (ตุรกี/อังการา และเวียดนาม/ฮานอย)

รูปที่ 4 การฝังจะสร้างแอนะล็อกที่โดดเด่นได้

พื้นที่ที่สําคัญเช่นนี้ช่วยให้ระบบแมชชีนเลิร์นนิงตรวจหารูปแบบที่อาจช่วยเหลืองานด้านการเรียนรู้ได้

ลดขนาดเครือข่าย

แม้ว่าเราจะต้องการมิติข้อมูลที่เพียงพอเพื่อเข้ารหัสความสัมพันธ์ทางอรรถศาสตร์ที่สมบูรณ์ เรายังต้องการพื้นที่ฝังที่มีขนาดเล็กพอที่จะทําให้ฝึกระบบได้เร็วขึ้น การฝังที่เป็นประโยชน์อาจเรียงตามลําดับมิติข้อมูลหลายร้อยรายการ ซึ่งน่าจะเป็นคําสั่งจํานวนมากที่มีขนาดน้อยกว่าคําศัพท์ของคุณ สําหรับงานที่ใช้ภาษาธรรมชาติ