تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
تجميع البيانات باستخدام خوارزمية k-means يمكن استخدام المسافة الإقليدية (الإعداد التلقائي) أو مسافة مانهاتن. في حال استخدام مسافة مانهاتن، يتم احتساب النقاط المركزية على أنّها الوسيط على مستوى المكوّن بدلاً من المتوسط. لمزيد من المعلومات، يُرجى الاطّلاع على:
د. آرثر، إس. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.
طريقة الإعداد التي سيتم استخدامها. 0 = عشوائي، 1 = k-means++، 2 = مظلة، 3 = الأبعد أولاً
canopies
قيمة منطقية، القيمة التلقائية: false
استخدِم المظلات لتقليل عدد عمليات حساب المسافة.
maxCandidates
عدد صحيح، القيمة التلقائية: 100
الحد الأقصى لعدد مظلات المرشحين التي سيتم الاحتفاظ بها في الذاكرة في أي وقت عند استخدام تجميع المظلات سيحدّد مدى التباعد بين النقاط من النوع T2، بالإضافة إلى خصائص البيانات، عدد المظلات المرشّحة التي سيتم إنشاؤها قبل إجراء عمليات التقليم الدورية والنهائية، ما قد يؤدي إلى استهلاك مفرط للذاكرة. يساعد هذا الإعداد في تجنُّب استهلاك عدد كبير من مظلات المرشحين للذاكرة.
periodicPruning
عدد صحيح، القيمة التلقائية: 10000
تحديد عدد مرات تقليم الأغصان ذات الكثافة المنخفضة عند استخدام ميزة "تجميع الأغصان"
minDensity
عدد صحيح، القيمة التلقائية: 2
الحد الأدنى لكثافة المظلة عند استخدام التجميع حسب المظلة، والذي سيتم بموجبه تقليم المظلة أثناء التقليم الدوري
t1
التعويم، القيمة التلقائية: -1.5
يشير ذلك إلى مسافة T1 المطلوب استخدامها عند استخدام التجميع المظلي. يتم اعتبار القيمة < 0 مضاعفًا موجبًا لـ T2.
t2
Float، القيمة التلقائية: -1
مسافة T2 المطلوب استخدامها عند استخدام التجميع المظلي تتسبّب القيم الأقل من 0 في استخدام قاعدة إرشادية تستند إلى الانحراف المعياري للسمة.
distanceFunction
سلسلة، القيمة التلقائية: "Euclidean"
دالة المسافة التي سيتم استخدامها الخيارات هي: Euclidean وManhattan.
maxIterations
عدد صحيح، القيمة التلقائية: null
الحدّ الأقصى لعدد التكرارات
preserveOrder
قيمة منطقية، القيمة التلقائية: false
الحفاظ على ترتيب الحالات
fast
قيمة منطقية، القيمة التلقائية: false
يتيح إجراء عمليات حسابية أسرع للمسافات باستخدام قيم الحدّ الأدنى. تؤدي إلى إيقاف احتساب/إخراج الأخطاء/المسافات المربّعة.
تاريخ التعديل الأخير: 2025-07-26 (حسب التوقيت العالمي المتفَّق عليه)
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],["تاريخ التعديل الأخير: 2025-07-26 (حسب التوقيت العالمي المتفَّق عليه)"],[[["Clusters data using the k-means algorithm with either Euclidean (default) or Manhattan distance."],["If Manhattan distance is selected, centroids are calculated using the component-wise median instead of the mean."],["Offers various initialization methods including random, k-means++, canopy, and farthest first."],["Allows customization of distance calculation, iteration limits, and performance optimization through parameters."]]],["The k-means algorithm clusters data using either Euclidean or Manhattan distance. Manhattan distance uses component-wise median for centroids, while Euclidean uses the mean. Initialization methods include random, k-means++, canopy, and farthest first. Canopies can be used to optimize distance calculations. Parameters control the number of clusters, pruning frequency, density thresholds, and distance settings. Additional options include limiting iterations, preserving data order, and using a fast distance calculation mode.\n"]]