API Nhận dạng văn bản của Bộ công cụ máy học có thể nhận dạng văn bản trong bất kỳ bộ ký tự nào dựa trên bộ La-tinh. Dữ liệu này cũng có thể được dùng để tự động hoá các tác vụ nhập dữ liệu như xử lý thẻ tín dụng, biên nhận và danh thiếp.
Các chức năng chính
- Nhận dạng văn bản trên các ngôn ngữ dựa trên tiếng Latinh Hỗ trợ nhận dạng văn bản bằng chữ viết Latinh
- Phân tích cấu trúc văn bản Hỗ trợ phát hiện các từ/phần tử, dòng và đoạn
- Xác định ngôn ngữ của văn bản Xác định ngôn ngữ của văn bản được nhận dạng
- Dấu vết ứng dụng nhỏ Trên Android, API được cung cấp dưới dạng một thư viện chưa nhóm thông qua Dịch vụ Google Play
- Nhận dạng văn bản theo thời gian thực Có thể nhận dạng văn bản theo thời gian thực trên nhiều thiết bị
Cấu trúc văn bản
Trình nhận dạng văn bản phân đoạn văn bản thành các khối, các dòng, các phần tử và biểu tượng. Nói gần đây:
Khối là một tập hợp các dòng văn bản liền kề, chẳng hạn như một đoạn văn hoặc cột,
Dòng là một tập hợp các từ liền kề nhau trên cùng một trục, và
Phần tử là một tập hợp các ký tự chữ cái liền kề ("word") trên cùng một trục ở hầu hết các ngôn ngữ La tinh hoặc một từ trong những ngôn ngữ khác
Biểu tượng là một ký tự chữ-số duy nhất trên cùng một trục trong hầu hết các ngôn ngữ La tinh hoặc một ký tự ở các ngôn ngữ khác
Hình ảnh bên dưới sẽ làm nổi bật ví dụ về từng giải pháp theo thứ tự giảm dần. Khối được làm nổi bật đầu tiên, bằng màu xanh lơ, là một Khối văn bản. Bộ khối thứ hai được đánh dấu, màu xanh lam, là các dòng văn bản. Cuối cùng, tập hợp các khối được đánh dấu thứ ba, có màu xanh đậm, là Words.
Đối với tất cả các khối, dòng, phần tử và ký hiệu được phát hiện, API sẽ trả về hộp giới hạn, điểm góc, thông tin xoay, điểm tin cậy, ngôn ngữ được nhận dạng và văn bản được nhận dạng.
Kết quả mẫu

Ảnh: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie – 2015 -- 8123", CC BY-SA 4.0
Văn bản được nhận dạng | |
---|---|
Văn bản | Wege der parlamentarischen demokratie |
Chặn bóng | (1 khối) |
Chặn 0 | |
---|---|
Văn bản | Vé Wege der parlamentarischen Demokratie |
Khung | (296, 665 - 796, 882) |
Điểm góc | (296, 719), (778, 665), (796, 828), (314, 882) |
Mã ngôn ngữ được công nhận | de |
Dòng | (3 dòng) |
Dòng 0 | |
---|---|
Văn bản | Wege der |
Khung | (434, 678 - 670, 749) |
Điểm góc | (434, 705), (665, 678), (670, 722), (439, 749) |
Mã ngôn ngữ được công nhận | de |
Mức độ tin cậy | 0,8766741 |
Độ xoay | -6,6116457 |
Các phần tử | (2 phần tử) |
Phần tử 0 | |
---|---|
Văn bản | Tiếng Wege |
Khung | (434, 689 – 575, 749) |
Điểm góc | (434, 705), (570, 689), (575, 733), (439, 749) |
Mã ngôn ngữ được công nhận | de |
Mức độ tin cậy | 0,8964844 |
Độ xoay | -6,6116457 |
Các phần tử | (4 phần tử) |
Ký hiệu 0 | |
---|---|
Văn bản | W |
Khung | (434, 698 - 500, 749) |
Điểm góc | (434, 706), (495, 698), (500, 741), (439, 749) |
Mức độ tin cậy | 0,87109375 |
Độ xoay | -6,611646 |