Computer >> Máy Tính >  >> Phần mềm >> Office

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Gần đây, việc tìm kiếm phần mềm Linux thực sự hay, mới, độc đáo đã trở thành một nhiệm vụ khó khăn. Một việc vặt. Và gần đây, ý tôi thực sự là khoảng bốn hoặc năm năm qua, ngay cả khi sự nhiệt tình và đổi mới trong không gian máy tính để bàn bắt đầu giảm dần. Xét cho cùng, số lượng nội dung tốt có thể tồn tại trong một khối lượng trí tuệ hữu hạn là có giới hạn, nhưng chúng ta đừng quên sự chuyển hướng sai trọng tâm sang thiết bị di động và sự tan vỡ của giấc mơ Linux hàng năm.

Điều này làm cho bài kiểm tra của tôi về một phần mềm bốn năm tuổi có tên là OCRFeeder hợp lệ, tôi nghĩ vậy. Vì hai lý do. Nếu nó tốt, nó tốt. Thứ hai, tôi luôn quan tâm đến tiến trình nhận dạng ký tự quang học và liệu các công cụ của chúng tôi (đọc là AI) có thể thực hiện công việc hợp lý ở đây hay không. Tôi đã viết chi tiết về vấn đề này cách đây một thời gian và sau đó xem xét YAGF vào năm 2015. Bây giờ, hãy xem OCRFeeder và những gì nó có thể làm. Hãy theo tôi, hỡi những chiến binh Linux dũng cảm.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Từ ngữ không dễ hiểu jpg

Tôi đã cài đặt chương trình. Có khá nhiều thư viện mà bạn cần lấy. Trong Ubuntu 18.04, danh sách có khá nhiều dòng. Bạn sử dụng công cụ Tesseract OCR làm bộ công cụ mặc định cho chương trình này.

Các gói bổ sung sau sẽ được cài đặt:
blt gir1.2-goocanvas-2.0 gir1.2-gtkspell3-3.0 libgoocanvas-2.0-9 libgoocanvas-2.0-common libgtkspell3-3-0 liblept5 libtesseract4 libyelp0 python-bs4 python- chardet python-enchant python-html5lib python-lxml python-numpy python-olefile python-pil python-renderpm python-reportlab python-reportlab-accel python-sane python-tk python-mã hóa web tesseract-ocr tesseract-ocr-eng tesseract-ocr -osd tk8.6-blt2.5 unpaper yelp yelp-xsl

Các gói đề xuất:
blt-demo python-gobject python-wxgtk3.0 python-genshi python-lxml-dbg python- lxml-doc gfortran python-dev python-nose python-numpy-dbg python-numpy-doc python-pil-doc python-pil-dbg python-renderpm-dbg python-egenix-mxtexttools python-reportlab-doc python-sane-dbg tix python-tk-dbg

Ra mắt nó. Giao diện là một chút tiện dụng. Trước tiên, bạn cần tải một hoặc nhiều hình ảnh, sau đó bạn sẽ sử dụng hình ảnh này để cung cấp cho công cụ OCR của mình và hy vọng rằng nó sẽ tạo ra văn bản có độ chính xác hợp lý ở đầu bên kia. Sau khi hoàn thành việc này, bạn có thể xuất văn bản sang LibreOffice.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Công cụ OCR

Như tôi đã đề cập, Theo mặc định, OCRFeeder sẽ sử dụng Tesseract, nhưng bạn có thể thêm bất kỳ công cụ nào khác mà bạn thích. Thật vậy, tôi đã thử CuneiForm, GOCR và Ocrad, và chương trình đã phát hiện và tải tất cả chúng một cách chính xác. Rât gọn gang. Điều này mang lại cho bạn khả năng thử tài liệu của mình theo nhiều cách, vì bạn có thể gặp nhiều may mắn hơn với một số công cụ này.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

sudo apt-get install gocr ocrad

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Chuyển đổi hình ảnh thành văn bản

Bây giờ, phần quan trọng. Tôi đã đấu tranh một chút ở đây. Tôi để chương trình tự động phát hiện văn bản (nhận dạng tất cả các trang) trong tất cả các hình ảnh có sẵn và tôi nhận được một số đầu ra được đánh dấu màu kỳ lạ. Quá trình này mất khoảng ba phút để hoàn thành đối với ba tệp PNG được tải và trong thời gian đó, mức sử dụng CPU của OCRFeeder là khoảng 17% và Tesseract đang sử dụng khoảng 4-5%. Vì vậy, thời gian chắc chắn có thể được rút ngắn nếu ứng dụng thực hiện tốt hơn việc sử dụng tất cả các lõi của bộ xử lý. Sau đó, đầu ra kỳ lạ. Tôi không chắc phải làm gì. Số lẻ. Có vẻ như tôi không tiến triển gì cả.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Sau đó, tôi nhận ra rằng tôi có thể sử dụng chuột để kéo và chọn các phần của hình ảnh được hiển thị, sau đó, một ngăn riêng sẽ mở ra, nơi tôi có thể chọn công cụ OCR mong muốn và chạy chuyển đổi thực tế. Bỏ qua trục trặc hình ảnh, tính năng này hoạt động khá tốt và chỉ mất vài giây để xử lý từng hình ảnh.

Không có bất kỳ đào tạo hoặc thay đổi mặc định nào, sự khác biệt về kết quả giữa bốn công cụ có sẵn là rất lớn. Tesseract hiển thị chuyển đổi tốt nhất - và duy nhất được chấp nhận. Phần còn lại không đủ tốt để cân nhắc sử dụng. Tôi không chắc tại sao, chỉ là như vậy thôi.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Tôi cũng nhận thấy kết quả tốt hơn với hình nền màu xám. Trong quá khứ, Tesseract đã gặp khó khăn, vì vậy bất kỳ cải tiến nào được đưa vào công cụ này đều được hoan nghênh. Nhưng sau đó, đây không hoàn toàn là một thứ của OCRFeeder và bạn có thể tự chạy Tesseract từ dòng lệnh nếu muốn.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Xếp giấy &tháo giấy

OCRFeeder đi kèm với hai chức năng tiện lợi - khả năng cố gắng tự động xoay văn bản khi quét hình ảnh bị lệch và khả năng loại bỏ nền giấy để giảm nhiễu và cho phép chuyển đổi chính xác hơn. Tôi đã thử cả hai tùy chọn và Deskew hoạt động tốt. Unpapering, như vậy. Nhưng sau khi tôi xoay văn bản (điều mà tôi đã làm trong GIMP khi kiểm soát hình ảnh trước đây), kết quả chuyển đổi thậm chí còn tốt hơn.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Xuất sang ODT

Đây là một chút khó khăn. Tôi đã thử điều này một vài lần và tôi gặp phải một loạt lỗi. Cuối cùng nó đã làm việc. Đầu ra không phải là đẹp nhất, nhưng điều tốt là bạn có thể xuất nhiều chuyển đổi cùng một lúc, bao gồm cả việc sử dụng các công cụ khác nhau cho các hình ảnh khác nhau. Khá tiện lợi.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Tùy chọn

Cuối cùng, bạn có tùy chọn để thay đổi hành vi của chương trình. Không có gì quá lớn, nhưng nó có thể giúp phát hiện và độ chính xác. Chủ yếu là do cách bạn phát hiện chiều rộng cột văn bản, lề, lựa chọn ngôn ngữ, v.v. Đối với hầu hết mọi người, giá trị mặc định sẽ là điểm khởi đầu hợp lý.

OCRFeder - Nơi hình ảnh chuyển đến văn bản

Kết luận

OCRFeeder là một phần mềm hợp lý, linh hoạt. Nó có thể sử dụng nhiều công cụ và các thuật toán sửa hình ảnh là một bổ sung tuyệt vời. Điều này làm cho OCRFeeder có lẽ là phần mềm hứa hẹn nhất thuộc loại này trên thị trường tự do, nhưng sau đó hy vọng của bạn phải tiêu tan ngay lập tức, bởi vì không có khả năng sớm nhận được bản cập nhật, trừ khi ai đó nhặt được phần mềm này. Bởi vì có thị trường trong lĩnh vực này, nhưng thế giới Linux đang bị mắc kẹt ở một vị trí khó khăn, giữa mệt mỏi và thờ ơ.

Bỏ vấn đề đó sang một bên, gạt vấn đề tuổi tác và cập nhật sang một bên, phần lớn, OCRFeeder đã phân phối. Chất lượng chuyển đổi không tệ, bạn không mất gì khi sử dụng giao diện người dùng để thực hiện công việc của mình và chức năng xuất cho phép bạn tạo các tài liệu đẹp để chỉnh sửa thêm, v.v. Tôi cũng hài lòng với những cải tiến trong Tesseract. Vì vậy, nếu bạn có một loạt các hình ảnh hài lòng với văn bản và bạn muốn thử chuyển đổi văn bản viết tay trên các hình thức cổ xưa thành một thứ gì đó hiện đại và có thể sử dụng được, bạn có thể làm điều này. OCRFeeder hỗ trợ PDF cũng như đọc trực tiếp từ máy quét. Rất đáng để thử nghiệm. Bây giờ là lúc để đi, tạm biệt.

Chúc mừng.