ee.Clusterer.wekaKMeans

k-মানে অ্যালগরিদম ব্যবহার করে ক্লাস্টার ডেটা। ইউক্লিডীয় দূরত্ব (ডিফল্ট) বা ম্যানহাটন দূরত্ব ব্যবহার করতে পারেন। যদি ম্যানহাটান দূরত্ব ব্যবহার করা হয়, তাহলে সেন্ট্রোয়েডগুলিকে কম্পোনেন্ট-ভিত্তিক মধ্যক হিসাবে গণনা করা হয়, গড় না করে। আরও তথ্যের জন্য দেখুন:

ডি. আর্থার, এস. ভ্যাসিলভিটস্কি: কে-মানে++: সাবধানে বীজ বপনের সুবিধা। ইন: ডিসক্রিট অ্যালগরিদম, 1027-1035, 2007-এর অষ্টাদশ বার্ষিক এসিএম-সিয়াম সিম্পোজিয়ামের কার্যক্রম।

ব্যবহার রিটার্নস
ee.Clusterer.wekaKMeans(nClusters, init , canopies , maxCandidates , periodicPruning , minDensity , t1 , t2 , distanceFunction , maxIterations , preserveOrder , fast , seed ) ক্লাস্টার
যুক্তি টাইপ বিস্তারিত
nClusters পূর্ণসংখ্যা ক্লাস্টার সংখ্যা।
init পূর্ণসংখ্যা, ডিফল্ট: 0 ব্যবহার করার জন্য সূচনা পদ্ধতি। 0 = এলোমেলো, 1 = k- মানে++, 2 = ক্যানোপি, 3 = সবচেয়ে দূরের প্রথম।
canopies বুলিয়ান, ডিফল্ট: মিথ্যা দূরত্বের গণনার সংখ্যা কমাতে ক্যানোপি ব্যবহার করুন।
maxCandidates পূর্ণসংখ্যা, ডিফল্ট: 100 ক্যানোপি ক্লাস্টারিং ব্যবহার করার সময় যে কোনো এক সময়ে মেমরিতে রাখতে প্রার্থী ক্যানোপির সর্বোচ্চ সংখ্যা। T2 দূরত্ব প্লাস, ডেটা বৈশিষ্ট্য, পর্যায়ক্রমিক এবং চূড়ান্ত ছাঁটাই সঞ্চালিত হওয়ার আগে কতগুলি প্রার্থী ক্যানোপি তৈরি করা হয়েছে তা নির্ধারণ করবে, যার ফলে অতিরিক্ত মেমরি খরচ হতে পারে। এই সেটিং মেমরি গ্রাসকারী প্রার্থী ক্যানোপির বড় সংখ্যা এড়ায়।
periodicPruning পূর্ণসংখ্যা, ডিফল্ট: 10000 ক্যানোপি ক্লাস্টারিং ব্যবহার করার সময় কত ঘন ঘন কম ঘনত্বের ক্যানোপি ছাঁটাই করতে হবে।
minDensity পূর্ণসংখ্যা, ডিফল্ট: 2 ন্যূনতম ক্যানোপি ঘনত্ব, ক্যানোপি ক্লাস্টারিং ব্যবহার করার সময়, যার নীচে পর্যায়ক্রমিক ছাঁটাইয়ের সময় একটি ছাঁটাই করা হবে।
t1 ফ্লোট, ডিফল্ট: -1.5 ক্যানোপি ক্লাস্টারিং ব্যবহার করার সময় ব্যবহার করার জন্য T1 দূরত্ব। একটি মান < 0 টি 2 এর জন্য ধনাত্মক গুণক হিসাবে নেওয়া হয়।
t2 ভাসা, ডিফল্ট: -1 ক্যানোপি ক্লাস্টারিং ব্যবহার করার সময় ব্যবহার করার জন্য T2 দূরত্ব। মান < 0 বৈশিষ্ট্য std এর উপর ভিত্তি করে একটি হিউরিস্টিক সৃষ্টি করে। বিচ্যুতি ব্যবহার করা হবে।
distanceFunction স্ট্রিং, ডিফল্ট: "ইউক্লিডীয়" ব্যবহার করার জন্য দূরত্ব ফাংশন। বিকল্পগুলি হল: ইউক্লিডিয়ান এবং ম্যানহাটন।
maxIterations পূর্ণসংখ্যা, ডিফল্ট: নাল পুনরাবৃত্তির সর্বাধিক সংখ্যা।
preserveOrder বুলিয়ান, ডিফল্ট: মিথ্যা দৃষ্টান্তের ক্রম সংরক্ষণ করুন।
fast বুলিয়ান, ডিফল্ট: মিথ্যা কাট-অফ মান ব্যবহার করে দ্রুত দূরত্বের গণনা সক্ষম করে। বর্গক্ষেত্র ত্রুটি/দূরত্বের গণনা/আউটপুট নিষ্ক্রিয় করে।
seed পূর্ণসংখ্যা, ডিফল্ট: 10 এলোমেলোকরণের বীজ।