How to extract text from images ?

Chào đều người, từ bây giờ mình sẽ trình làng cách làm rứa nào để có thể đọc được text trường đoản cú hình hình ảnh có sẵn. Trước tiên đi vào tiến hành (code) bản thân sẽ trình diễn sơ qua về dòng mà mình sẽ thực hiện đó là công nghệ nhận dạng ký kết tự quang học tập OCR. Vậy thì OCR là gì ???

1. Khái niệm

OCR là một thuật ngữ viết tắt từ nhiều từ Optical Character Recognition có thể dịch nôm na nó là dấn dạng ký kết tự bằng quang học. Đây là technology được áp dụng để phát âm text trên một file ảnh thành định dạng text.

Bạn đang xem: Finereader pdf

2. Ứng dụng

Chắc hẳn các bạn đã một lần áp dụng đến công nghệ nhưng không để ý, vì họ chỉ thực hiện nó một cách gián tiếp sẽ là máy Scanner. OCR được áp dụng như một phần mềm được tích hợp trên máy vi tính hoặc thẳng vào một phần cứng làm sao đó. Một trong những phần mượt khá lừng danh như:

ABBYY FineReaderPDF OCR...

Trong số những phần mềm đó thì bản thân nghĩ ABBYY FineReader là phần mềm xuất sắc nhất, đơn giản dễ dàng vì thời sinh viên mình rất hấp dẫn dùng ứng dụng này để convert đều file PDF quý phái word nhằm copy cho nhanh đỡ nên gõ lại (haha)

3. Hạn chế của OCR

Bên cạnh đó thì OCR cũng còn không hề ít những giảm bớt như:

Hầu hết các ứng dụng sử dụng OCR chỉ thừa nhận dạng được khoảng 80 - 90% trên hình hình ảnh rõ nét.Đối với đều hình hình ảnh có màu sắc nền mà màu chữ không có không ít chênh lệch, hay các hình chụp chữ viết tay thì tác dụng nhận dạng ko khả quan mang đến lắmĐến thời điểm hiện tại thì OCR chưa support tất cả các ngôn ngữ.

4. Kiến thiết demo tác dụng Extract text from Image thực hiện OCR

Mình vẫn code demo cứng cáp năng này cùng với CakePHP và áp dụng IDOLOCR API (A.hihi)

IDOL OCR API là gì thì mình xin reviews nhanh, nó là một trong web-service và bạn có thể dử dụng service này sinh sống nhiều ngôn từ như PHP , Java , .NET , Python,…etc. Còn trong khuôn khổ bài viết này thì mình vẫn sử dụng ngữ điệu PHP =))IDOL OCR API support những format sau:

- Image FormatsTIFFJPEGPNGGIFBMP and ICOPBM, PGM, và PPM- Document FormatsAdobe PDF (PDF)Microsoft Word Documnent (DOC và DOCX)Microsoft Excel Sheet (XLS and XLSX)Microsoft Powerpoint Presentation (PPT và PPTX)OpenDocument Text (ODT)Rich Text (RTF)

Để sử dụng service này thì việc cần có tác dụng những cách sau

Bước 1

Đăng ký kết một thông tin tài khoản tại đây

Bước 2

Đăng nhập và copy API Key tại đây

*

Xong 2 cách trên bạn đã có thể thực hiện service này rồi, chúng ta có thể sử dụng web service này đối với tất cả phương thức POST với GET, còn trong chạy thử này mình sẽ áp dụng phương thức POST thôi nhóe!

Lý thuyết nhiều rồi, nào! hiện giờ là lúc các bạn bắt tay vào triển khai một tính năng để phát âm được gần như gì mình đã ra mắt bên trên. Tất cả những thứ bạn phải làm là 1 trong action và một view diễn tả giao diện của kích hoạt đó.

View: TopPages/extract_text_from_images.ctp

document_photo: (default) Use to lớn recognize text in a document that has been digitized with variable light, such as through a mobile phone camera.

document_scan: Use to recognize text in a document that has been digitized with constant lighting, such as through a flatbed scanner.

scene_photo: Use to lớn recognize text in a scene, for example signs và billboards in a landscape.

subtitle: Use lớn recognize text superimposed on an image, such as TV subtitles.

Xem thêm: 5 Bộ Sách Giáo Khoa Lớp 1 Năm 2021 2022, Top 9 Bộ Sách Giáo Khoa Lớp 1 Năm 2022

Ứng cùng với từng mode thì text được extract ra hình ảnh là khác nhau, tại chỗ này mình lựa chọn mode là subtitle bời vì đa số các hình hình ảnh mình tiến hành đề có dạng văn bạn dạng chồng lên hình hình ảnh

*
Bạn hoàn toàn có thể tìm hiểu rõ hơn https://dev.havenondemand.com/apis/ocrdocument#overview.

Controllers/TopPages/extractTextFromImages

public function extractTextFromImages() { $urlApi = "https://inthepasttoys.net/http://api.havenondemand.com/1/api/sync/ocrdocument/v1?apikey="https://inthepasttoys.net/ . APIKEY_HAVENONDEMAND . "https://inthepasttoys.net/&languages=en&languages=ja"https://inthepasttoys.net/; $output_dir = "https://inthepasttoys.net/img/"https://inthepasttoys.net/; $subject = $skillNumber = $scanOCR = $image = "https://inthepasttoys.net/"https://inthepasttoys.net/; if(isset($_FILES<"https://inthepasttoys.net/file"https://inthepasttoys.net/>)) { $fileName = $_FILES<"https://inthepasttoys.net/file"https://inthepasttoys.net/><"https://inthepasttoys.net/name"https://inthepasttoys.net/>; $image = $fileName; move_uploaded_file($_FILES<"https://inthepasttoys.net/file"https://inthepasttoys.net/><"https://inthepasttoys.net/tmp_name"https://inthepasttoys.net/>, $output_dir . $fileName); $filePath = realpath($output_dir . $fileName); $post = < "https://inthepasttoys.net/file"https://inthepasttoys.net/ =>"https://inthepasttoys.net/