iOS এ ML কিট দিয়ে ডিজিটাল কালি শনাক্ত করা

এমএল কিট-এর ডিজিটাল কালি শনাক্তকরণের সাহায্যে, আপনি শত শত ভাষায় ডিজিটাল পৃষ্ঠে হাতে লেখা পাঠ্য শনাক্ত করতে এবং স্কেচ শ্রেণীবদ্ধ করতে পারবেন।

চেষ্টা করে দেখুন

  • এই API-টির একটি উদাহরণমূলক ব্যবহার দেখতে নমুনা অ্যাপটি ব্যবহার করে দেখুন।

শুরু করার আগে

  1. আপনার Podfile-এ নিম্নলিখিত ML Kit লাইব্রেরিগুলো অন্তর্ভুক্ত করুন:

    pod 'GoogleMLKit/DigitalInkRecognition', '8.0.0'
    
    
  2. আপনার প্রোজেক্টের পডগুলো ইনস্টল বা আপডেট করার পর, সেটির .xcworkspace ব্যবহার করে আপনার Xcode প্রোজেক্টটি খুলুন। ML Kit, Xcode ভার্সন 13.2.1 বা তার পরবর্তী সংস্করণগুলোতে সমর্থিত।

আপনি এখন Ink অবজেক্টগুলিতে টেক্সট শনাক্ত করা শুরু করতে প্রস্তুত।

একটি Ink অবজেক্ট তৈরি করুন

একটি Ink অবজেক্ট তৈরি করার প্রধান উপায় হলো টাচ স্ক্রিনে এটি আঁকা। iOS-এ, আপনি টাচ ইভেন্ট হ্যান্ডলারসহ একটি UIImageView ব্যবহার করতে পারেন, যা স্ক্রিনে স্ট্রোকগুলো আঁকে এবং Ink অবজেক্টটি তৈরি করার জন্য স্ট্রোকগুলোর পয়েন্টও সংরক্ষণ করে। এই সাধারণ প্যাটার্নটি নিম্নলিখিত কোড স্নিপেটে দেখানো হয়েছে। আরও সম্পূর্ণ উদাহরণের জন্য কুইকস্টার্ট অ্যাপটি দেখুন, যেখানে টাচ ইভেন্ট হ্যান্ডলিং, স্ক্রিন ড্রয়িং এবং স্ট্রোক ডেটা ম্যানেজমেন্টকে আলাদা করা হয়েছে।

সুইফট

@IBOutlet weak var mainImageView: UIImageView!
var kMillisecondsPerTimeInterval = 1000.0
var lastPoint = CGPoint.zero
private var strokes: [Stroke] = []
private var points: [StrokePoint] = []

func drawLine(from fromPoint: CGPoint, to toPoint: CGPoint) {
  UIGraphicsBeginImageContext(view.frame.size)
  guard let context = UIGraphicsGetCurrentContext() else {
    return
  }
  mainImageView.image?.draw(in: view.bounds)
  context.move(to: fromPoint)
  context.addLine(to: toPoint)
  context.setLineCap(.round)
  context.setBlendMode(.normal)
  context.setLineWidth(10.0)
  context.setStrokeColor(UIColor.white.cgColor)
  context.strokePath()
  mainImageView.image = UIGraphicsGetImageFromCurrentImageContext()
  mainImageView.alpha = 1.0
  UIGraphicsEndImageContext()
}

override func touchesBegan(_ touches: Set, with event: UIEvent?) {
  guard let touch = touches.first else {
    return
  }
  lastPoint = touch.location(in: mainImageView)
  let t = touch.timestamp
  points = [StrokePoint.init(x: Float(lastPoint.x),
                             y: Float(lastPoint.y),
                             t: Int(t * kMillisecondsPerTimeInterval))]
  drawLine(from:lastPoint, to:lastPoint)
}

override func touchesMoved(_ touches: Set, with event: UIEvent?) {
  guard let touch = touches.first else {
    return
  }
  let currentPoint = touch.location(in: mainImageView)
  let t = touch.timestamp
  points.append(StrokePoint.init(x: Float(currentPoint.x),
                                 y: Float(currentPoint.y),
                                 t: Int(t * kMillisecondsPerTimeInterval)))
  drawLine(from: lastPoint, to: currentPoint)
  lastPoint = currentPoint
}

override func touchesEnded(_ touches: Set, with event: UIEvent?) {
  guard let touch = touches.first else {
    return
  }
  let currentPoint = touch.location(in: mainImageView)
  let t = touch.timestamp
  points.append(StrokePoint.init(x: Float(currentPoint.x),
                                 y: Float(currentPoint.y),
                                 t: Int(t * kMillisecondsPerTimeInterval)))
  drawLine(from: lastPoint, to: currentPoint)
  lastPoint = currentPoint
  strokes.append(Stroke.init(points: points))
  self.points = []
  doRecognition()
}

উদ্দেশ্য-সি

// Interface
@property (weak, nonatomic) IBOutlet UIImageView *mainImageView;
@property(nonatomic) CGPoint lastPoint;
@property(nonatomic) NSMutableArray *strokes;
@property(nonatomic) NSMutableArray *points;

// Implementations
static const double kMillisecondsPerTimeInterval = 1000.0;

- (void)drawLineFrom:(CGPoint)fromPoint to:(CGPoint)toPoint {
  UIGraphicsBeginImageContext(self.mainImageView.frame.size);
  [self.mainImageView.image drawInRect:CGRectMake(0, 0, self.mainImageView.frame.size.width,
                                                  self.mainImageView.frame.size.height)];
  CGContextMoveToPoint(UIGraphicsGetCurrentContext(), fromPoint.x, fromPoint.y);
  CGContextAddLineToPoint(UIGraphicsGetCurrentContext(), toPoint.x, toPoint.y);
  CGContextSetLineCap(UIGraphicsGetCurrentContext(), kCGLineCapRound);
  CGContextSetLineWidth(UIGraphicsGetCurrentContext(), 10.0);
  CGContextSetRGBStrokeColor(UIGraphicsGetCurrentContext(), 1, 1, 1, 1);
  CGContextSetBlendMode(UIGraphicsGetCurrentContext(), kCGBlendModeNormal);
  CGContextStrokePath(UIGraphicsGetCurrentContext());
  CGContextFlush(UIGraphicsGetCurrentContext());
  self.mainImageView.image = UIGraphicsGetImageFromCurrentImageContext();
  UIGraphicsEndImageContext();
}

- (void)touchesBegan:(NSSet *)touches withEvent:(nullable UIEvent *)event {
  UITouch *touch = [touches anyObject];
  self.lastPoint = [touch locationInView:self.mainImageView];
  NSTimeInterval time = [touch timestamp];
  self.points = [NSMutableArray array];
  [self.points addObject:[[MLKStrokePoint alloc] initWithX:self.lastPoint.x
                                                         y:self.lastPoint.y
                                                         t:time * kMillisecondsPerTimeInterval]];
  [self drawLineFrom:self.lastPoint to:self.lastPoint];
}

- (void)touchesMoved:(NSSet *)touches withEvent:(nullable UIEvent *)event {
  UITouch *touch = [touches anyObject];
  CGPoint currentPoint = [touch locationInView:self.mainImageView];
  NSTimeInterval time = [touch timestamp];
  [self.points addObject:[[MLKStrokePoint alloc] initWithX:currentPoint.x
                                                         y:currentPoint.y
                                                         t:time * kMillisecondsPerTimeInterval]];
  [self drawLineFrom:self.lastPoint to:currentPoint];
  self.lastPoint = currentPoint;
}

- (void)touchesEnded:(NSSet *)touches withEvent:(nullable UIEvent *)event {
  UITouch *touch = [touches anyObject];
  CGPoint currentPoint = [touch locationInView:self.mainImageView];
  NSTimeInterval time = [touch timestamp];
  [self.points addObject:[[MLKStrokePoint alloc] initWithX:currentPoint.x
                                                         y:currentPoint.y
                                                         t:time * kMillisecondsPerTimeInterval]];
  [self drawLineFrom:self.lastPoint to:currentPoint];
  self.lastPoint = currentPoint;
  if (self.strokes == nil) {
    self.strokes = [NSMutableArray array];
  }
  [self.strokes addObject:[[MLKStroke alloc] initWithPoints:self.points]];
  self.points = nil;
  [self doRecognition];
}

লক্ষ্য করুন যে, কোড স্নিপেটটিতে UIImageView-এর মধ্যে স্ট্রোক আঁকার জন্য একটি নমুনা ফাংশন অন্তর্ভুক্ত রয়েছে, যা আপনার অ্যাপ্লিকেশনের প্রয়োজন অনুযায়ী পরিবর্তন করে নিতে হবে। আমরা লাইন সেগমেন্টগুলো আঁকার সময় রাউন্ডক্যাপস (roundcaps) ব্যবহার করার পরামর্শ দিই, যাতে শূন্য দৈর্ঘ্যের সেগমেন্টগুলো একটি ডট (বিন্দু) হিসাবে আঁকা হয় (ছোট হাতের 'i' অক্ষরের উপরের ডটটির কথা ভাবুন)। প্রতিটি স্ট্রোক লেখার পরে doRecognition() ফাংশনটি কল করা হয় এবং এটি নীচে সংজ্ঞায়িত করা হবে।

DigitalInkRecognizer এর একটি ইনস্ট্যান্স পান

রিকগনিশন সম্পাদন করার জন্য আমাদের একটি DigitalInkRecognizer ইনস্ট্যান্সে Ink অবজেক্টটি পাস করতে হবে। DigitalInkRecognizer ইনস্ট্যান্সটি পাওয়ার জন্য, প্রথমে আমাদের কাঙ্ক্ষিত ভাষার জন্য রিকগনাইজার মডেলটি ডাউনলোড করতে হবে এবং মডেলটিকে র‍্যামে লোড করতে হবে। এটি নিম্নলিখিত কোড স্নিপেট ব্যবহার করে সম্পন্ন করা যেতে পারে, যা সরলতার জন্য viewDidLoad() মেথডে রাখা হয়েছে এবং একটি হার্ডকোডেড ভাষার নাম ব্যবহার করে। ব্যবহারকারীকে উপলব্ধ ভাষার তালিকা কীভাবে দেখাতে হয় এবং নির্বাচিত ভাষাটি কীভাবে ডাউনলোড করতে হয় তার একটি উদাহরণের জন্য কুইকস্টার্ট অ্যাপটি দেখুন।

সুইফট

override func viewDidLoad() {
  super.viewDidLoad()
  let languageTag = "en-US"
  let identifier = DigitalInkRecognitionModelIdentifier(forLanguageTag: languageTag)
  if identifier == nil {
    // no model was found or the language tag couldn't be parsed, handle error.
  }
  let model = DigitalInkRecognitionModel.init(modelIdentifier: identifier!)
  let modelManager = ModelManager.modelManager()
  let conditions = ModelDownloadConditions.init(allowsCellularAccess: true,
                                         allowsBackgroundDownloading: true)
  modelManager.download(model, conditions: conditions)
  // Get a recognizer for the language
  let options: DigitalInkRecognizerOptions = DigitalInkRecognizerOptions.init(model: model)
  recognizer = DigitalInkRecognizer.digitalInkRecognizer(options: options)
}

উদ্দেশ্য-সি

- (void)viewDidLoad {
  [super viewDidLoad];
  NSString *languagetag = @"en-US";
  MLKDigitalInkRecognitionModelIdentifier *identifier =
      [MLKDigitalInkRecognitionModelIdentifier modelIdentifierForLanguageTag:languagetag];
  if (identifier == nil) {
    // no model was found or the language tag couldn't be parsed, handle error.
  }
  MLKDigitalInkRecognitionModel *model = [[MLKDigitalInkRecognitionModel alloc]
                                          initWithModelIdentifier:identifier];
  MLKModelManager *modelManager = [MLKModelManager modelManager];
  [modelManager downloadModel:model conditions:[[MLKModelDownloadConditions alloc]
                                                initWithAllowsCellularAccess:YES
                                                allowsBackgroundDownloading:YES]];
  MLKDigitalInkRecognizerOptions *options =
      [[MLKDigitalInkRecognizerOptions alloc] initWithModel:model];
  self.recognizer = [MLKDigitalInkRecognizer digitalInkRecognizerWithOptions:options];
}

কুইকস্টার্ট অ্যাপগুলোতে অতিরিক্ত কোড অন্তর্ভুক্ত রয়েছে, যা দেখায় কীভাবে একই সময়ে একাধিক ডাউনলোড পরিচালনা করতে হয় এবং ডাউনলোড সম্পন্ন হওয়ার নোটিফিকেশনগুলো হ্যান্ডেল করার মাধ্যমে কোন ডাউনলোডটি সফল হয়েছে তা কীভাবে নির্ধারণ করতে হয়।

একটি Ink বস্তু শনাক্ত করুন

এরপর আমরা doRecognition() ফাংশনে আসি, যা সরলতার জন্য touchesEnded() থেকে কল করা হয়। অন্যান্য অ্যাপ্লিকেশনে কেউ হয়তো একটি টাইমআউটের পরে, অথবা ব্যবহারকারী রিকগনিশন চালু করার জন্য কোনো বাটন চাপলে, রিকগনিশন শুরু করতে চাইতে পারেন।

সুইফট

func doRecognition() {
  let ink = Ink.init(strokes: strokes)
  recognizer.recognize(
    ink: ink,
    completion: {
      [unowned self]
      (result: DigitalInkRecognitionResult?, error: Error?) in
      var alertTitle = ""
      var alertText = ""
      if let result = result, let candidate = result.candidates.first {
        alertTitle = "I recognized this:"
        alertText = candidate.text
      } else {
        alertTitle = "I hit an error:"
        alertText = error!.localizedDescription
      }
      let alert = UIAlertController(title: alertTitle,
                                  message: alertText,
                           preferredStyle: UIAlertController.Style.alert)
      alert.addAction(UIAlertAction(title: "OK",
                                    style: UIAlertAction.Style.default,
                                  handler: nil))
      self.present(alert, animated: true, completion: nil)
    }
  )
}

উদ্দেশ্য-সি

- (void)doRecognition {
  MLKInk *ink = [[MLKInk alloc] initWithStrokes:self.strokes];
  __weak typeof(self) weakSelf = self;
  [self.recognizer
      recognizeInk:ink
        completion:^(MLKDigitalInkRecognitionResult *_Nullable result,
                     NSError *_Nullable error) {
    typeof(weakSelf) strongSelf = weakSelf;
    if (strongSelf == nil) {
      return;
    }
    NSString *alertTitle = nil;
    NSString *alertText = nil;
    if (result.candidates.count > 0) {
      alertTitle = @"I recognized this:";
      alertText = result.candidates[0].text;
    } else {
      alertTitle = @"I hit an error:";
      alertText = [error localizedDescription];
    }
    UIAlertController *alert =
        [UIAlertController alertControllerWithTitle:alertTitle
                                            message:alertText
                                     preferredStyle:UIAlertControllerStyleAlert];
    [alert addAction:[UIAlertAction actionWithTitle:@"OK"
                                              style:UIAlertActionStyleDefault
                                            handler:nil]];
    [strongSelf presentViewController:alert animated:YES completion:nil];
  }];
}

মডেল ডাউনলোড পরিচালনা করা

আমরা ইতিমধ্যে দেখেছি কিভাবে একটি রিকগনিশন মডেল ডাউনলোড করতে হয়। নিম্নলিখিত কোড স্নিপেটগুলো দেখায় কিভাবে পরীক্ষা করতে হয় যে একটি মডেল ইতিমধ্যেই ডাউনলোড করা হয়েছে কিনা, অথবা স্টোরেজ স্পেস পুনরুদ্ধার করার জন্য যখন একটি মডেলের আর প্রয়োজন হয় না তখন সেটিকে ডিলিট করতে হয়।

মডেলটি ইতিমধ্যে ডাউনলোড করা হয়েছে কিনা তা পরীক্ষা করুন।

সুইফট

let model : DigitalInkRecognitionModel = ...
let modelManager = ModelManager.modelManager()
modelManager.isModelDownloaded(model)

উদ্দেশ্য-সি

MLKDigitalInkRecognitionModel *model = ...;
MLKModelManager *modelManager = [MLKModelManager modelManager];
[modelManager isModelDownloaded:model];

ডাউনলোড করা মডেলটি মুছে ফেলুন

সুইফট

let model : DigitalInkRecognitionModel = ...
let modelManager = ModelManager.modelManager()

if modelManager.isModelDownloaded(model) {
  modelManager.deleteDownloadedModel(
    model!,
    completion: {
      error in
      if error != nil {
        // Handle error
        return
      }
      NSLog(@"Model deleted.");
    })
}

উদ্দেশ্য-সি

MLKDigitalInkRecognitionModel *model = ...;
MLKModelManager *modelManager = [MLKModelManager modelManager];

if ([self.modelManager isModelDownloaded:model]) {
  [self.modelManager deleteDownloadedModel:model
                                completion:^(NSError *_Nullable error) {
                                  if (error) {
                                    // Handle error.
                                    return;
                                  }
                                  NSLog(@"Model deleted.");
                                }];
}

পাঠ্য শনাক্তকরণের নির্ভুলতা উন্নত করার উপায়

বিভিন্ন ভাষার ক্ষেত্রে টেক্সট শনাক্তকরণের নির্ভুলতা ভিন্ন হতে পারে। নির্ভুলতা লেখার ধরনের উপরও নির্ভর করে। যদিও ডিজিটাল ইঙ্ক রিকগনিশন অনেক ধরনের লেখার ধরন সামলানোর জন্য প্রশিক্ষিত, তবুও এর ফলাফল ব্যবহারকারীভেদে ভিন্ন হতে পারে।

একটি টেক্সট রিকগনাইজারের নির্ভুলতা উন্নত করার কয়েকটি উপায় এখানে দেওয়া হলো। উল্লেখ্য যে, এই কৌশলগুলো ইমোজি, অটোড্র এবং শেপের ড্রয়িং ক্লাসিফায়ারগুলোর ক্ষেত্রে প্রযোজ্য নয়।

লেখার জায়গা

অনেক অ্যাপ্লিকেশনে ব্যবহারকারীর ইনপুটের জন্য একটি সুনির্দিষ্ট লেখার জায়গা থাকে। কোনো প্রতীকের অর্থ আংশিকভাবে নির্ধারিত হয় সেটিকে ধারণকারী লেখার জায়গার আকারের সাপেক্ষে তার আকারের দ্বারা। উদাহরণস্বরূপ, ছোট বা বড় হাতের অক্ষর 'o' বা 'c', এবং কমা ও ফরওয়ার্ড স্ল্যাশের মধ্যে পার্থক্য।

রিকগনাইজারকে লেখার জায়গার প্রস্থ এবং উচ্চতা জানিয়ে দিলে নির্ভুলতা বাড়তে পারে। তবে, রিকগনাইজার ধরে নেয় যে লেখার জায়গাটিতে কেবল এক লাইনের লেখা রয়েছে। যদি লেখার জায়গাটি ব্যবহারকারীকে দুই বা ততোধিক লাইন লেখার সুযোগ দেওয়ার মতো যথেষ্ট বড় হয়, তাহলে আপনি এক লাইনের লেখার উচ্চতার আপনার সেরা অনুমান অনুযায়ী একটি WritingArea অবজেক্ট পাস করে আরও ভালো ফলাফল পেতে পারেন। আপনি রিকগনাইজারকে যে WritingArea অবজেক্টটি পাস করেন, সেটিকে স্ক্রিনের লেখার জায়গার সাথে হুবহু মিলতে হবে এমন কোনো বাধ্যবাধকতা নেই। এইভাবে WritingArea-এর উচ্চতা পরিবর্তন করা কিছু ভাষায় অন্যদের তুলনায় ভালো কাজ করে।

লেখার ক্ষেত্র নির্দিষ্ট করার সময়, এর প্রস্থ এবং উচ্চতা স্ট্রোক স্থানাঙ্কের এককের সাথে মিলিয়ে উল্লেখ করুন। x,y স্থানাঙ্ক আর্গুমেন্টগুলোর কোনো এককের বাধ্যবাধকতা নেই — এপিআই সমস্ত একককে স্বাভাবিক করে, তাই একমাত্র গুরুত্বপূর্ণ বিষয় হলো স্ট্রোকগুলোর আপেক্ষিক আকার এবং অবস্থান। আপনার সিস্টেমের জন্য সুবিধাজনক যেকোনো স্কেলে আপনি স্থানাঙ্ক প্রদান করতে পারেন।

পূর্ব-প্রসঙ্গ

প্রি-কন্টেক্সট হলো সেই টেক্সট যা আপনি শনাক্ত করার চেষ্টা করছেন এমন Ink -এর স্ট্রোকগুলোর ঠিক আগে থাকে। আপনি প্রি-কন্টেক্সট সম্পর্কে জানিয়ে শনাক্তকারীকে সাহায্য করতে পারেন।

উদাহরণস্বরূপ, কারসিভ অক্ষর 'n' এবং 'u' প্রায়শই একটিকে অন্যটি বলে ভুল করা হয়। যদি ব্যবহারকারী ইতিমধ্যেই 'arg' শব্দটি আংশিকভাবে লিখে থাকেন, তবে তিনি এমনভাবে লিখতে পারেন যা 'ument' বা 'nment' হিসাবে চেনা যায়। এক্ষেত্রে, পূর্ব-প্রসঙ্গ 'arg' উল্লেখ করলে এই অস্পষ্টতা দূর হয়, কারণ সেক্ষেত্রে 'argnment'-এর চেয়ে 'argument' শব্দটি আসার সম্ভাবনা বেশি থাকে।

প্রি-কনটেক্সট রিকগনাইজারকে শব্দের মাঝের ফাঁকা স্থান বা ওয়ার্ড ব্রেক শনাক্ত করতেও সাহায্য করতে পারে। আপনি একটি স্পেস ক্যারেক্টার টাইপ করতে পারেন কিন্তু আঁকতে পারেন না, তাহলে একটি রিকগনাইজার কীভাবে নির্ধারণ করবে যে একটি শব্দ কখন শেষ হয় এবং পরেরটি শুরু হয়? যদি ব্যবহারকারী ইতিমধ্যেই "hello" লিখে থাকেন এবং এরপর "world" শব্দটি লেখেন, তাহলে প্রি-কনটেক্সট ছাড়া রিকগনাইজার "world" স্ট্রিংটি রিটার্ন করবে। কিন্তু, যদি আপনি প্রি-কনটেক্সট হিসেবে "hello" নির্দিষ্ট করে দেন, তাহলে মডেলটি শুরুতে একটি স্পেসসহ "world" স্ট্রিংটি রিটার্ন করবে, কারণ "helloword"-এর চেয়ে "hello world" বেশি অর্থবহ।

আপনাকে স্পেস সহ সর্বোচ্চ ২০ অক্ষরের সম্ভাব্য দীর্ঘতম প্রি-কন্টেক্সট স্ট্রিংটি প্রদান করতে হবে। স্ট্রিংটি এর চেয়ে দীর্ঘ হলে, রিকগনাইজারটি শুধুমাত্র শেষের ২০টি অক্ষর ব্যবহার করে।

নিচের কোড নমুনাটিতে দেখানো হয়েছে কীভাবে একটি লেখার ক্ষেত্র নির্ধারণ করতে হয় এবং প্রাক-প্রসঙ্গ নির্দিষ্ট করার জন্য একটি RecognitionContext অবজেক্ট ব্যবহার করতে হয়।

সুইফট

let ink: Ink = ...;
let recognizer: DigitalInkRecognizer =  ...;
let preContext: String = ...;
let writingArea = WritingArea.init(width: ..., height: ...);

let context: DigitalInkRecognitionContext.init(
    preContext: preContext,
    writingArea: writingArea);

recognizer.recognizeHandwriting(
  from: ink,
  context: context,
  completion: {
    (result: DigitalInkRecognitionResult?, error: Error?) in
    if let result = result, let candidate = result.candidates.first {
      NSLog("Recognized \(candidate.text)")
    } else {
      NSLog("Recognition error \(error)")
    }
  })

উদ্দেশ্য-সি

MLKInk *ink = ...;
MLKDigitalInkRecognizer *recognizer = ...;
NSString *preContext = ...;
MLKWritingArea *writingArea = [MLKWritingArea initWithWidth:...
                                              height:...];

MLKDigitalInkRecognitionContext *context = [MLKDigitalInkRecognitionContext
       initWithPreContext:preContext
       writingArea:writingArea];

[recognizer recognizeHandwritingFromInk:ink
            context:context
            completion:^(MLKDigitalInkRecognitionResult
                         *_Nullable result, NSError *_Nullable error) {
                               NSLog(@"Recognition result %@",
                                     result.candidates[0].text);
                         }];

স্ট্রোক অর্ডারিং

শনাক্তকরণের নির্ভুলতা লেখার ক্রমের উপর নির্ভরশীল। শনাক্তকারী যন্ত্রগুলো আশা করে যে, লেখার ক্রমটি মানুষ স্বাভাবিকভাবে যেভাবে লেখে, সেভাবেই হবে; যেমন, ইংরেজির ক্ষেত্রে বাম থেকে ডানে। এই নিয়ম থেকে যেকোনো বিচ্যুতি, যেমন ইংরেজি বাক্যের শেষ শব্দটি দিয়ে বাক্য শুরু করা, কম নির্ভুল ফলাফল দেয়।

এর আরেকটি উদাহরণ হলো যখন কোনো Ink মাঝখান থেকে একটি শব্দ মুছে ফেলে তার জায়গায় অন্য একটি শব্দ বসানো হয়। সংশোধনটি সম্ভবত একটি বাক্যের মাঝখানে করা হয়েছে, কিন্তু সংশোধনের জন্য স্ট্রোকগুলো স্ট্রোক সিকোয়েন্সের শেষে রয়েছে। এই ক্ষেত্রে আমরা পরামর্শ দিই যে, নতুন লেখা শব্দটি আলাদাভাবে এপিআই-তে পাঠান এবং আপনার নিজস্ব লজিক ব্যবহার করে পূর্ববর্তী শনাক্তকরণগুলোর সাথে ফলাফলটি মার্জ করুন।

অস্পষ্ট আকার নিয়ে কাজ করা

এমন কিছু ক্ষেত্র আছে যেখানে শনাক্তকারীকে দেওয়া আকৃতির অর্থ অস্পষ্ট থাকে। উদাহরণস্বরূপ, খুব গোলাকার প্রান্তযুক্ত একটি আয়তক্ষেত্রকে আয়তক্ষেত্র বা উপবৃত্ত উভয় হিসাবেই দেখা যেতে পারে।

এই অস্পষ্ট পরিস্থিতিগুলো রিকগনিশন স্কোর ব্যবহার করে সমাধান করা যায়, যদি তা পাওয়া যায়। শুধুমাত্র শেপ ক্লাসিফায়ারগুলোই স্কোর প্রদান করে। যদি মডেলটি খুব আত্মবিশ্বাসী হয়, তবে সেরা ফলাফলের স্কোর দ্বিতীয় সেরার চেয়ে অনেক ভালো হবে। যদি অনিশ্চয়তা থাকে, তবে সেরা দুটি ফলাফলের স্কোর কাছাকাছি হবে। এছাড়াও, মনে রাখতে হবে যে শেপ ক্লাসিফায়ারগুলো পুরো Ink একটি একক আকৃতি হিসেবে ব্যাখ্যা করে। উদাহরণস্বরূপ, যদি Ink পাশাপাশি একটি আয়তক্ষেত্র এবং একটি উপবৃত্ত থাকে, তবে রিকগনাইজারটি ফলাফল হিসেবে দুটির মধ্যে যেকোনো একটি (বা সম্পূর্ণ ভিন্ন কিছু) ফেরত দিতে পারে, কারণ একটি একক রিকগনিশন ক্যান্ডিডেট দুটি আকৃতিকে উপস্থাপন করতে পারে না।