Nhận dạng văn bản v2

API Nhận dạng văn bản của Bộ công cụ máy học phiên bản 2 có thể nhận dạng văn bản bằng bất kỳ bộ ký tự tiếng Trung, tiếng GoogleDoodle, tiếng Nhật, tiếng Hàn và tiếng Latinh. API cũng có thể được dùng để tự động hoá các công việc nhập dữ liệu, chẳng hạn như xử lý thẻ tín dụng, biên nhận và danh thiếp.

iOS Android

Các chức năng chính

  • Nhận dạng văn bản trên nhiều tập lệnh và ngôn ngữ Hỗ trợ việc nhận dạng văn bản bằng tiếng Trung, tiếng BrailleBack, tiếng Nhật, tiếng Hàn và tiếng Latinh
  • Phân tích cấu trúc văn bản Hỗ trợ phát hiện các ký hiệu, phần tử, dòng và đoạn văn bản
  • Xác định ngôn ngữ của văn bản Xác định ngôn ngữ của văn bản được nhận dạng
  • Nhận dạng theo thời gian thực Có thể nhận dạng văn bản theo thời gian thực trên nhiều loại thiết bị

Cấu trúc văn bản

Trình nhận dạng văn bản phân đoạn văn bản thành các khối, dòng, phần tử và ký hiệu. Nói đại khái:

  • Khối là một tập hợp các dòng văn bản liền kề, chẳng hạn như một đoạn văn hoặc cột,

  • Đường là một tập hợp các từ liền kề trên cùng một trục và

  • Phần tử là một bộ ký tự chữ-số liền kề ("từ") trên cùng một trục trong hầu hết các ngôn ngữ Latinh hoặc một từ trong các ngôn ngữ khác

  • Biểu tượng là một ký tự bao gồm chữ và số trên cùng một trục ở hầu hết các ngôn ngữ Latinh hoặc một ký tự trong các ngôn ngữ khác

Hình ảnh dưới đây nêu bật ví dụ về từng yếu tố theo thứ tự giảm dần. Khối nổi bật đầu tiên (trong màu xanh lơ) là một khối văn bản. Bộ khối thứ hai được đánh dấu, màu xanh lam, là Các dòng văn bản. Cuối cùng, tập hợp các khối thứ ba được làm nổi bật (màu xanh dương đậm) là Word.

Đối với tất cả các khối, đường kẻ, phần tử và ký hiệu được phát hiện, API sẽ trả về hộp giới hạn, điểm góc, thông tin xoay, điểm tin cậy, ngôn ngữ được nhận dạng và văn bản được nhận dạng.

Kết quả mẫu


Ảnh: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Văn bản được nhận dạng
Văn bản Ưu đãi
der parlamentarischen
demokratie
Chặn bóng (1 khối)
Khối 0
Văn bản Wege der parlamentarischen Demokratie
Khung hình (296, 665 – 796, 882)
Điểm góc (296, 719), (778, 665), (796, 828), (314, 882)
Mã ngôn ngữ được nhận dạng de
Dòng (3 dòng)
Dòng 0
Văn bản Wege der
Khung hình (434, 678 – 670, 749)
Điểm góc (434, 705), (665, 678), (670, 722), (439, 749)
Mã ngôn ngữ được nhận dạng de
Điểm tin cậy 0,8766741
Độ xoay -6,6116457
Các phần tử (2 phần tử)
Yếu tố 0
Văn bản Ưu đãi
Khung hình (434, 689 - 575, 749)
Điểm góc (434, 705), (570, 689), (575, 733), (439, 749)
Mã ngôn ngữ được nhận dạng de
Điểm tin cậy 0,8964844
Độ xoay -6,6116457
Các phần tử (4 phần tử)
Biểu tượng 0
Văn bản W
Khung hình (434, 698 – 500, 749)
Điểm góc (434, 706), (495, 698), (500, 741), (439, 749)
Điểm tin cậy 0,87109375
Độ xoay -6,611646