Dựng nước - Giữ nước

Thông tin chung => Chung sức xây dựng website => Tác giả chủ đề:: Giangtvx trong 08 Tháng Ba, 2017, 11:03:24 PM



Tiêu đề: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 08 Tháng Ba, 2017, 11:03:24 PM
         
HƯỚNG DẪN SỬ DỤNG ABBYY FINEREADER

        I - GIỚI THIỆU ABBYY FINEREADER

        ABBYY FineReader là một hệ thống nhận dạng ký tự quang học (OCR) chuyển đổi các tài liệu đã được quét, tài liệu PDF và các tệp hình ảnh (bao gồm ảnh kỹ thuật số) sang định dạng có thể chỉnh sửa.

        Lợi thế của ABBYY FineReader 12

        1/ Nhận dạng nhanh và chính xác

        •   Công nghệ OCR được sử dụng trong ABBYY FineReader nhận dạng và giữ lại định dạng gốc của mọi tài liệu nhanh chóng và chính xác.

        •   Nhờ Công nghệ nhận dạng tài liệu thích ứng (ADRT®) của ABBYY, ABBYY FineReader có thể phân tích và xử lý toàn bộ tài liệu, thay vì từng trang trong một lúc. Phương pháp này giữ lại cấu trúc của tài liệu nguồn, bao gồm định dạng, siêu liên kết, địa chỉ email, đầu trang và chân trang, chú thích hình ảnh và bảng, số trang và ghi chú cuối trang.

        •   ABBYY FineReader phần lớn không có lỗi in và có thể nhận dạng văn bản được in bằng hầu như mọi phông chữ.

        •   ABBYY FineReader có thể nhận dạng ảnh văn bản thu được bằng máy ảnh thông thường hoặc điện thoại di động. Xử lý sơ bộ ảnh bổ sung có thể cải thiện đáng kể chất lượng ảnh, làm cho OCR chính xác hơn.

        •   Để xử lý nhanh hơn, ABBYY FineReader tận dụng hiệu quả các bộ xử lý nhiều lõi và cung cấp chế độ xử lý đen trắng đặc biệt cho các tài liệu không cần giữ nguyên màu.

        2/ Hỗ trợ hầu hết các ngôn ngữ trên thế giới

        ABBYY FineReader có thể nhận dạng văn bản được viết bằng bất kỳ ngôn ngữ nào trong số 190 ngôn ngữ được hỗ trợ hoặc kết hợp những ngôn ngữ này. Trong số các ngôn ngữ được hỗ trợ có Tiếng Ả Rập, Tiếng Việt, Tiếng Hàn, Tiếng Trung, Tiếng Nhật, Tiếng Thái và Tiếng Do Thái. ABBYY FineReader có thể tự động phát hiện ngôn ngữ của tài liệu.

        3/ Khả năng kiểm tra kết quả OCR

        •   ABBYY FineReader có chỉnh sửa văn bản tích hợp cho phép bạn so sánh văn bản được nhận dạng so với hình ảnh gốc và thực hiện mọi thay đổi cần thiết.

        •   Nếu bạn không hài lòng với kết quả xử lý tự động, bạn có thể chỉ định thủ công vùng hình ảnh cần chụp và lập mẫu cho chương trình nhận dạng các phông chữ không phổ biến hoặc ít dùng.

        4/ Giao diện người dùng trực quan

        •   Chương trình có một số tác vụ tự động hóa được cấu hình trước bao gồm các tình huống OCR phổ biến nhất và cho phép bạn chuyển đổi ảnh quét, tệp PDF và hình ảnh thành tài liệu có thể chỉnh sửa với một lần nhấp vào nút. Tích hợp với Microsoft Office và Windows Explorer có nghĩa là bạn có thể nhận dạng tài liệu trực tiếp ngay trong Microsoft Outlook, Microsoft Word, Microsoft Excel hoặc chỉ bằng cách nhấp chuột phải vào tệp trong máy tính của bạn.

        •   Chương trình hỗ trợ các phím tắt trong Windows và thao tác vuốt trên màn hình cảm ứng thông thường, ví dụ: để cuộn hoặc phóng to và thu nhỏ hình ảnh.

        5/ Trích dẫn nhanh

        Bạn có thể dễ dàng sao chép và dán các đoạn được nhận dạng vào các ứng dụng khác. Hình ảnh trang sẽ mở ngay và sẽ có sẵn để xem, chọn và sao chép trước khi toàn bộ tài liệu được nhận dạng.

        6/ Nhận dạng ảnh kỹ thuật số

   Bạn có thể chụp ảnh tài liệu bằng máy ảnh kỹ thuật số và ABBYY FineReader 12 sẽ nhận dạng văn bản như thể đó là ảnh quét thông thường.

        7/ Lưu trữ PDF

        •   ABBYY FineReader có thể chuyển đổi tài liệu giấy hoặc PDF được quét thành tài liệu PDF và PDF/A có thể tìm kiếm.

        •   Có thể áp dụng nén MRC để giảm kích cỡ tệp PDF mà không ảnh hưởng đến chất lượng hình ảnh.

        8/ Hỗ trợ nhiều định dạng lưu và các dịch vụ lưu trữ đám mây

        •   ABBYY FineReader 12 có thể lưu văn bản được nhận dạng trong các định dạng Microsoft Office (Word, Excel và PowerPoint), trong định dạng PDF/A và PDF có thể tìm kiếm để lưu trữ lâu dài và trong các định dạng sách điện tử phổ biến.

        •   Bạn có thể lưu kết quả cục bộ hoặc trong các dịch vụ lưu trữ đám mây (Google Drive, Dropbox và SkyDrive) và truy cập chúng từ bất kỳ đâu trên thế giới. ABBYY FineReader 12 cũng có thể kết xuất tài liệu trực tiếp sang Microsoft SharePoint Online và Microsoft Office 365.

        9/ Bao gồm hai ứng dụng tặng thêm — ABBYY Business Card Reader và ABBYY Screenshot Reader

        •   ABBYY Business Card Reader (chỉ có sẵn với ABBYY FineReader 12 Corporate) là tiện ích thuận tiện chụp dữ liệu từ danh thiếp và lưu chúng trực tiếp vào Microsoft® Outlook®, Salesforce và các phần mềm quản lý danh bạ khác.

        •   ABBYY Screenshot Reader là chương trình dễ sử dụng có thể chụp ảnh màn hình của toàn bộ cửa sổ hoặc các vùng đã chọn và nhận dạng văn bản bên trong.

        10/ Hỗ trợ kỹ thuật miễn phí dành cho người dùng đã đăng ký

        Nhóm các ngôn ngữ được hỗ trợ có thể khác nhau trong các phiên bản khác nhau của sản phẩm.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 09 Tháng Ba, 2017, 09:06:57 AM
         
        II - TÍNH NĂNG MỚI

        Dưới đây là tổng quan nhanh về các tính năng chính mới và những cải tiến đã được đưa vào ABBYY FineReader 12.

        1/ Độ chính xác nhận dạng được cải thiện

        Phiên bản mới của ABBYY FineReader mang lại khả năng OCR chính xác hơn và tái tạo định dạng gốc của tài liệu tốt hơn nhờ các cải tiến trong Công nghệ nhận dạng tài liệu thích ứng (ADRT) độc quyền của ABBYY. Chương trình giờ đây phát hiện kiểu tài liệu, tiêu đề và bảng tốt hơn, để bạn không phải định dạng lại tài liệu sau khi chúng được nhận dạng.

        2/ Ngôn ngữ nhận dạng

        ABBYY FineReader 12 giờ đây có thể nhận dạng văn bản Tiếng Nga có dấu trọng âm. Chất lượng OCR đã được cải thiện cho Tiếng Trung, Tiếng Nhật, Tiếng Hàn, Tiếng Ả Rập và Tiếng Do Thái.

        3/ Giao diện người dùng nhanh hơn và thân thiện hơn

        •        Xử lý nền

        Có thể mất khá nhiều thời gian để nhận dạng các tài liệu rất lớn. Trong phiên bản mới, các tiến trình tốn nhiều thời gian chạy trên nền, cho phép bạn tiếp tục làm việc trên những phần tài liệu đã được nhận dạng. Bây giờ bạn không phải đợi quy trình OCR hoàn thành trước khi bạn có thể điều chỉnh các vùng hình ảnh, xem các trang không được nhận dạng, ép khởi động OCR của một trang cụ thể hoặc vùng hình ảnh, thêm trang từ các nguồn khác hoặc xếp lại thứ tự các trang trong tài liệu.

        •        Tải hình ảnh nhanh hơn

        Hình ảnh trang sẽ xuất hiện trong chương trình ngay khi bạn quét bản gốc tài liệu giấy, để bạn có thể thấy kết quả quét ngay và chọn các trang và vùng hình ảnh để nhận dạng.

        •        Trích dẫn dễ dàng hơn

        Mọi vùng hình ảnh chứa văn bản, ảnh hoặc bảng có thể được nhận dạng và sao chép dễ dàng vào Bộ nhớ tạm với một lần nhấp chuột.

        •        Tất cả các thao tác cơ bản, bao gồm cuộn và thu phóng, giờ đây cũng được hỗ trợ trên màn hình cảm ứng.

        4/ Xử lý sơ bộ ảnh và OCR máy ảnh

        Thuật toán xử lý sơ bộ ảnh được cải thiện đảm bảo nhận dạng tốt hơn văn bản được chụp và tạo ảnh văn bản trông đẹp như ảnh quét. Khả năng sửa ảnh mới bao gồm tự động xén, sửa biến dạng hình học và làm đều độ sáng và màu nền.

        ABBYY FineReader 12 cho phép bạn chọn các tùy chọn xử lý sơ bộ bạn muốn áp dụng cho bất kỳ hình ảnh mới được thêm nào, để bạn sẽ không cần sửa riêng từng hình ảnh.

        5/ Chất lượng hình ảnh tốt hơn cho các tài liệu được lưu trữ

        ABBYY FineReader 12 bao gồm công nghệ PreciseScan mới, làm mịn các ký tự để cải thiện chất lượng hình ảnh của tài liệu quét. Vì vậy, các ký tự không giống như bị răng cưa ngay cả khi bạn phóng to trên trang.

        6/ Các công cụ mới để chỉnh sửa thủ công kết quả nhận dạng

        Khả năng xác minh và sửa đã được mở rộng trong phiên bản mới. Trong ABBYY FineReader 12, bạn có thể định dạng văn bản được nhận dạng trong cửa sổ xác minh, giờ đây cũng bao gồm một công cụ để chèn các ký hiệu đặc biệt không có trên bàn phím tiêu chuẩn. Bạn cũng có thể sử dụng phím tắt cho hầu hết các lệnh xác minh và sửa thường xuyên nhất.

        Trong ABBYY FineReader 12, bạn có thể tắt tính năng tái tạo các thành phần cấu trúc như đầu trang, chân trang, chú thích cuối trang, mục lục và danh sách đánh số. Điều này có thể cần thiết nếu bạn muốn những thành phần này xuất hiện như văn bản thông thường để tương thích tốt hơn với các sản phẩm khác, ví dụ: phần mềm dịch thuật và phần mềm ghi tên tác giả sách điện tử.

        7/ Các tùy chọn lưu mới

        •        Khi lưu kết quả OCR vào XLSX, bây giờ bạn có thể lưu ảnh, xóa bỏ định dạng văn bản và lưu mỗi trang vào một bảng tính Excel riêng.

        •        ABBYY FineReader 12 có thể tạo các tệp ePub tương thích với chuẩn EPUB 2.0.1 và EPUB 3.0.

        8/ Tích hợp với các dịch vụ và ứng dụng bên thứ ba được cải thiện

        Giờ đây, bạn có thể kết xuất tài liệu được nhận dạng trực tiếp sang định dạng SharePoint Online và Microsoft Office 365 và các hộp thoại mở và lưu mới cung cấp truy cập dễ dàng vào các dịch vụ lưu trữ đám mây, như Google Drive, Dropbox và SkyDrive.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 10 Tháng Ba, 2017, 10:32:06 AM
          
        III – MÀN HÌNH KHỞI ĐỘNG

        ABBYY FineReader chuyển đổi các tài liệu đã được quét, tài liệu PDF và các tệp hình ảnh (bao gồm ảnh kỹ thuật số) sang định dạng có thể chỉnh sửa. Khi khởi động, màn hình ban đầu có dạng sau:

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABB0_zpsx2q2tzc0.jpg)

        Để xử lý tài liệu với ABBYY FineReader, bạn cần hoàn thành bốn bước sau:
 
        •        Thu hình ảnh của tài liệu
        •        Nhận dạng tài liệu
        •        Xác minh kết quả
        •        Lưu kết quả ở định dạng mà bạn chọn

        Nếu bạn cần lặp lại những bước này nhiều lần, bạn có thể sử dụng một tác vụ tự động hóa, tác vụ này sẽ thực hiện những thao tác được yêu cầu với chỉ một cú nhấp vào nút. Để xử lý tài liệu có bố cục phức tạp, bạn có thể tùy chỉnh và thực hiện riêng từng bước.

        1/ Các tác vụ tự động hóa tích hợp

        Khi bạn khởi động ABBYY FineReader, cửa sổ Tác vụ sẽ hiển thị, liệt kê các tác vụ tự động hóa cho những tình huống xử lý phổ biến nhất. Nếu bạn không thể nhìn thấy cửa sổ Tác vụ, nhấp vào nút Tác vụ trên thanh công cụ chính.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABB1_zpsx8dhlxr3.jpg)
       
        a. Trong cửa sổ Tác vụ, nhấp vào một tab bên trái: (Phần màu đỏ trên hình là phần thêm vào của bài viết)

           - Khởi động nhanh chứa các tác vụ ABBYY FineReader phổ biến nhất

           - Microsoft Word chứa những tác vụ tự động chuyển đổi tài liệu sang định dạng Microsoft Word

           - Microsoft Excel chứa những tác vụ tự động chuyển đổi tài liệu sang định dạng Microsoft Excel

           - Adobe PDF chứa những tác vụ tự động chuyển đổi tài liệu sang định dạng PDF

           - Khác chứa những tác vụ tự động chuyển đổi tài liệu sang định dạng khác
           - Tác vụ của tôi chứa những tác vụ tùy chỉnh của bạn (chỉ ABBYY FineReader Corporate)

        b. Từ danh sách thả xuống Ngôn ngữ tài liệu, chọn ngôn ngữ trong tài liệu của bạn.

        c. Từ danh sách thả xuống Chế độ màu, chọn một chế độ màu:

           - Màu đầy đủ giữ lại màu của tài liệu;

           - Đen trắng chuyển đổi tài liệu sang dạng đen trắng, giúp giảm kích cỡ và tăng tốc độ xử lý.

           - Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu. Để có tài liệu màu, quét tài liệu giấy ở chế độ màu hoặc mở một tệp có hình ảnh màu.

        d. Nếu bạn định chạy tác vụ Microsoft Word, Microsoft Excel hoặc PDF, hãy chỉ định tùy chọn tài liệu bổ sung trong phần bên phải của cửa sổ.

        e. Bắt đầu tác vụ bằng cách nhấp vào các nút trong cửa sổ Tác vụ.

        Khi bạn bắt đầu một tác vụ, tác vụ sẽ sử dụng các tùy chọn hiện được chọn trong hộp thoại Tùy chọn (nhấp vào Công cụ > Tùy chọn… để mở hộp thoại).

        Trong khi một tác vụ đang chạy, cửa sổ tiến trình tác vụ sẽ hiển thị, cho biết danh sách các bước và thông báo do chương trình đưa ra.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABB2_zpsusubog5i.jpg)

        Sau khi thực hiện tác vụ, hình ảnh sẽ được thêm vào tài liệu FineReader, được nhận dạng và lưu ở định dạng mà bạn chọn. Bạn có thể điều chỉnh các vùng do chương trình phát hiện được, xác minh văn bản đã được nhận dạng và lưu kết quả ở bất kỳ định dạng được hỗ trợ nào khác.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 11 Tháng Ba, 2017, 08:23:23 AM

        2/ Các bước chuyển đổi tài liệu
 
        Sau khi cửa sổ ĐỌC nhận dạng xong tài liệu chương trình xuất hiện như màn hình dưới đây:

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABB3_zpsncmcu42p.jpg)

        Bạn có thể thiết lập và bắt đầu bất kỳ bước nào trong các bước xử lý trong cửa sổ chính của ABBYY FineReader.

­        - Trên thanh công cụ chính, chọn ngôn ngữ tài liệu từ danh sách thả xuống Ngôn ngữ tài liệu.

­        - Quét các trang hoặc mở hình ảnh trang.

        Lưu ý: Theo mặc định, ABBYY FineReader sẽ tự động phân tích và nhận dạng các trang được quét hoặc mở. Bạn có thể thay đổi cách xử lý mặc định này trên Quét/Mở của hộp thoại Tùy chọn (nhấp vào Công cụ > Tùy chọn… để mở hộp thoại).

­­        - Trong cửa sổ Hình ảnh, xem lại những vùng đã được phát hiện và thực hiện bất kỳ điều chỉnh cần thiết nào.

­­        - Nếu bạn đã điều chỉnh bất kỳ vùng nào, nhấp Đọc trên thanh công cụ chính để nhận dạng lại chúng.

­­        - Trong cửa sổ Văn bản, xem lại kết quả nhận dạng và thực hiện bất kỳ sửa chữa cần thiết nào.

­­        - Nhấp vào mũi tên bên phải nút Lưu trên thanh công cụ chính và chọn một định dạng lưu. Hoặc, nhấp vào lệnh lưu trên menu Tệp.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 12 Tháng Ba, 2017, 08:41:28 AM
        
       3/ Tạo tác vụ tự động hóa tùy chỉnh (Chỉ ABBYY FineReader Corporate)

        Bạn có thể tạo các tác vụ tự động hóa của mình nếu bạn cần đưa vào các bước xử lý không có trong các tác vụ tự động hóa tích hợp.

­        - Trong cửa sổ Tác vụ, nhấp vào tab Tác vụ của tôi rồi nhấp vào nút Tạo mới.

­        - Trong hộp thoại Cài đặt tác vụ, nhập tên cho tác vụ của bạn trong hộp Tên tác vụ.
­           
        - Trong ngăn bên trái, chọn loại tài liệu ABBYY FineReader để sử dụng cho tác vụ:

            + Tại tài liệu mới
Nếu bạn chọn tùy chọn này, một tài liệu ABBYY FineReader mới sẽ được tạo khi bạn bắt đầu tác vụ. Sau đó chỉ định tùy chọn tài liệu mà chương trình sẽ sử dụng để xử lý tài liệu của bạn. Bạn có thể chọn giữa các tùy chọn chung được chỉ định trong chương trình hoặc các tùy chọn mà bạn sẽ chỉ định cho tác vụ cụ thể này.

             + Chọn tài liệu hiện có

        Chọn tùy chọn này nếu bạn muốn tác vụ xử lý hình ảnh từ một tài liệu FineReader hiện có. Bạn sẽ phải định rõ tài liệu FineReader hoặc lựa chọn được chương trình nhắc chọn tài liệu mỗi khi tác vụ bắt đầu.

             + Sử dụng tài liệu hiện tại

        Nếu bạn chọn tùy chọn này, hình ảnh từ tài liệu ABBYY FineReader hiện hoạt sẽ được xử lý.

        Chọn cách bạn sẽ thu được hình ảnh:
   
                * Mở hình ảnh hoặc PDF

                Chọn tùy chọn này nếu bạn muốn tác vụ xử lý hình ảnh hoặc tài liệu PDF từ một thư mục. Bạn sẽ phải định rõ thư mục hoặc lựa chọn được chương trình nhắc chọn thư mục mỗi khi tác vụ bắt đầu.

           * Quét

                Nếu bạn chọn tùy chọn này, bạn sẽ cần quét các trang.(Lưu ý: Bước này là tùy chọn nếu trước đó bạn đã chọn Chọn tài liệu hiện có hoặc Sử dụng tài liệu hiện tại).

           Nếu hình ảnh được thêm vào tài liệu đã chứa hình ảnh, chỉ những hình ảnh mới thêm sẽ được xử lý.

           Nếu tài liệu ABBYY FineReader cần xử lý chứa một số trang đã được nhận dạng và một số trang đã được phân tích, các trang được nhận dạng sẽ không được xử lý lại và các trang đã phân tích sẽ được nhận dạng.

                Thêm bước Phân tích để phát hiện các vùng trên hình ảnh và cấu hình bước này: Phân tích bố cục tự động, sau đó điều chỉnh các vùng theo cách thủ công. ABBYY FineReader sẽ phân tích hình ảnh và xác định các vùng dựa trên nội dung của chúng.

           Khoanh vùng bằng tay: ABBYY FineReader sẽ yêu cầu bạn khoanh các vùng phù hợp theo cách thủ công.

           Sử dụng mẫu vùng: Chọn tùy chọn này nếu bạn muốn sử dụng mẫu vùng hiện có khi chương trình phân tích tài liệu. Bạn sẽ phải định rõ mẫu hoặc lựa chọn được chương trình nhắc chọn mẫu mỗi khi tác vụ bắt đầu. Để biết chi tiết, xem "Sử dụng mẫu vùng".

           Thêm bước Đọc nếu bạn cần nhận dạng hình ảnh. Chương trình sẽ sử dụng các tùy chọn nhận dạng mà bạn đã chỉ định trong bước 3. (Lưu ý: Khi bạn thêm bước Đọc, bước Phân tích được thêm vào tự động).

           Thêm Đọc để lưu văn bản được nhận dạng trong định dạng mà bạn chọn, gửi văn bản hoặc hình ảnh qua email hoặc tạo bản sao của tài liệu ABBYY FineReader. Một tác vụ có thể bao gồm nhiều bước Đọc:

           Lưu tài liệu: Tại đây, bạn có thể chỉ định tên tệp, định dạng tệp, tùy chọn tệp và thư mục nơi tệp được lưu. (Lưu ý: Để tránh chỉ định một thư mục mới mỗi lần tác vụ được bắt đầu, chọn Tạo thư mục con có dấu thời gian.)

           Gửi tài liệu: Tại đây, bạn có thể chọn ứng dụng để mở tài liệu thu được.

           Gửi tài liệu qua email: Tại đây, bạn có thể chỉ định tên tệp, định dạng tệp, tùy chọn tệp và địa chỉ email mà tệp sẽ được gửi đến

           Lưu hình ảnh: Tại đây, bạn có thể chỉ định tên tệp, định dạng tệp, tùy chọn tệp và thư mục nơi tệp hình ảnh được lưu (Lưu ý: Để lưu tất cả hình ảnh vào một tệp, chọn Lưu làm một tệp hình ảnh nhiều trang (chỉ áp dụng cho hình ảnh trong định dạng TIFF, PDF, JB2, JBIG2 và DCX)).

           Gửi hình ảnh qua email: Tại đây, bạn có thể chỉ định tên tệp, định dạng tệp, tùy chọn tệp và địa chỉ email mà tệp hình ảnh sẽ được gửi đến.

           Lưu tài liệu FineReader: Tại đây, bạn có thể chỉ định thư mục mà tài liệu ABBYY FineReader sẽ được lưu vào.

           Chỉ định các tùy chọn mà chương trình sẽ sử dụng để lưu kết quả. Bạn có thể chọn giữa các tùy chọn chung được chỉ định trong chương trình tại thời điểm lưu hoặc các tùy chọn mà bạn sẽ chỉ định cho tác vụ cụ thể này.

           Xóa bỏ các bước không cần thiết khỏi tác vụ (Lưu ý: Đôi khi, xóa bỏ một bước cũng sẽ làm cho các bước khác bị xóa bỏ. Ví dụ: nếu bạn xóa bỏ bước Phân tích, bước Đọc cũng sẽ bị xóa bỏ, vì không thể thực hiện nhận dạng mà không phân tích hình ảnh).

           Sau khi bạn đã cấu hình tất cả các bước cần thiết, nhấp vào Kết thúc.

           Tác vụ mới được tạo sẽ xuất hiện trên tab Tác vụ của tôi trong cửa sổ Tác vụ. Bạn có thể lưu tác vụ của mình bằng cách sử dụng Trình quản lý tác vụ (nhấp vào Công cụ > Trình quản lý tác vụ… để mở Trình quản lý tác vụ).

           Bạn cũng có thể tải tác vụ đã tạo trước đây: trên tab Tác vụ của tôi, nhấp vào Tải từ đĩa và chọn tệp chứa tác vụ bạn cần.

           Trong ABBYY FineReader, bạn có thể sửa đổi, sao chép, xóa, nhập và kết xuất các tác vụ tự động hóa tùy chỉnh. Để biết chi tiết, xem "Tác vụ tự động hóa".


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 12 Tháng Ba, 2017, 09:22:11 PM
        
        IV – CÁC DẠNG DỮ LIỆU

        1/ Microsoft Word

        Sử dụng tác vụ trên tab Khởi động nhanh của cửa sổ Tác vụ, bạn có thể dễ dàng quét tài liệu giấy và chuyển đổi tài liệu thành tệp Microsoft Word có thể chỉnh sửa. Tùy chọn chương trình hiện đã chọn sẽ được sử dụng. Nếu bạn muốn tùy chỉnh tùy chọn chuyển đổi, sử dụng tác vụ trên tab Microsoft Word.

        a. Từ danh sách thả xuống Ngôn ngữ tài liệu ở đầu cửa sổ, chọn ngôn ngữ tài liệu của bạn.

        b. Trong danh sách thả xuống Chế độ màu, chọn chế độ màu đầy đủ hoặc đen trắng.

        - Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu.

­        - Chọn tùy chọn tài liệu mong muốn trong phần bên phải của cửa sổ: Tùy chọn bố cục tài liệu
­
        - Chọn Giữ lại ảnh nếu bạn muốn giữ lại ảnh trong tài liệu đầu ra
­   
        - Chọn Giữ lại đầu trang và chân trang nếu bạn muốn giữ lại đầu trang và chân trang trong tài liệu đầu ra

­        - Để biết thêm về các tùy chọn lưu có sẵn cho Microsoft Word, xem "Lưu tài liệu có thể chỉnh sửa".

        c. Nhấp vào nút của tác vụ mà bạn cần:

­        - Quét sang dạng Microsoft Word quét tài liệu giấy và chuyển thành Microsoft Word

­        - Hình ảnh hoặc Tệp PDF sang dạng Microsoft Word chuyển đổi tài liệu PDF hoặc tệp hình ảnh thành Microsoft Word

­        - Ảnh sang dạng Microsoft Word chuyển đổi ảnh của tài liệu thành Microsoft Word

        d. Kết quả là, tài liệu Microsoft Word mới sẽ được tạo chứa văn bản tài liệu gốc của bạn.

        Quan trọng! Khi bạn bắt đầu tác vụ tích hợp, tùy chọn chương trình hiện đã chọn sẽ được sử dụng. Nếu bạn quyết định thay đổi bất kỳ tùy chọn nào, bạn sẽ cần khởi động lại tác vụ.

        2/ Microsoft Excel

        Sử dụng tác vụ trên tab Microsoft Excel của cửa sổ Tác vụ, bạn có thể dễ dàng chuyển đổi hình ảnh của bảng thành Microsoft Excel.

        a. Từ danh sách thả xuống Ngôn ngữ tài liệu ở đầu cửa sổ, chọn ngôn ngữ tài liệu của bạn.

        b.Trong danh sách thả xuống Chế độ màu, chọn chế độ màu đầy đủ hoặc đen trắng.

        Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu.

        c. Chọn tùy chọn tài liệu mong muốn trong phần bên phải của cửa sổ:Tùy chọn bố cục tài liệu

        - Chọn Giữ lại ảnh nếu bạn muốn giữ lại ảnh trong tài liệu đầu ra

        - Chọn Tạo bảng tính riêng cho mỗi trang nếu bạn muốn mỗi trang của tài liệu gốc được lưu dưới dạng bảng tính Microsoft Excel riêng

        - Để biết thêm về các tùy chọn lưu có sẵn cho Microsoft Excel, xem "Lưu bảng".

        d. Nhấp vào nút của tác vụ mà bạn cần:

        - Quét sang dạng Microsoft Excel quét tài liệu giấy và chuyển đổi thành Microsoft Excel

        - Hình ảnh hoặc Tệp PDF sang dạng Microsoft Excel chuyển đổi tài liệu PDF hoặc tệp hình ảnh thành Microsoft Excel

        - Ảnh sang dạng Microsoft Excel chuyển đổi ảnh của tài liệu thành Microsoft Excel

       e.  Kết quả là, tài liệu Microsoft Excel mới sẽ được tạo chứa văn bản tài liệu gốc của bạn.

       f. Quan trọng! Khi bạn bắt đầu tác vụ tích hợp, tùy chọn chương trình hiện đã chọn sẽ được sử dụng. Nếu bạn quyết định thay đổi bất kỳ tùy chọn nào, bạn sẽ cần khởi động lại tác vụ.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 13 Tháng Ba, 2017, 09:32:55 PM

        3/ Adobe PDF

        Sử dụng tác vụ trên tab Adobe PDF của cửa sổ Tác vụ, bạn có thể dễ dàng chuyển đổi hình ảnh (ví dụ: tài liệu được quét, tệp PDF và tệp hình ảnh) thành PDF.

        a. Từ danh sách thả xuống Ngôn ngữ tài liệu ở đầu cửa sổ, chọn ngôn ngữ tài liệu của bạn.

        b. Trong danh sách thả xuống Chế độ màu, chọn chế độ màu đầy đủ hoặc đen trắng.

        Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu.

        c. Chọn tùy chọn tài liệu mong muốn trong phần bên phải của cửa sổ:

­           - Chỉ văn bản và hình ảnh:Tùy chọn này chỉ lưu văn bản được nhận dạng và ảnh. Văn bản sẽ có thể được tìm kiếm đầy đủ và kích cỡ tệp PDF sẽ nhỏ. Hình thức của tài liệu thu được có thể hơi khác so với bản gốc.

­           - Văn bản trên hình ảnh trang: Tùy chọn này lưu nền và ảnh của tài liệu gốc và đặt văn bản được nhận dạng trên nền và ảnh. Thông thường, loại tệp PDF này yêu cầu nhiều dung lượng đĩa trống hơn Chỉ văn bản và hình ảnh. Tài liệu PDF thu được có thể được tìm kiếm đầy đủ. Trong một số trường hợp, hình thức của tài liệu thu được có thể hơi khác so với bản gốc.

­           - Văn bản dưới hình ảnh trang: Tùy chọn này lưu toàn bộ hình ảnh trang dưới dạng ảnh và đặt văn bản được nhận dạng ở bên dưới ảnh đó. Sử dụng tùy chọn này để tạo tài liệu có thể tìm kiếm đầy đủ trông gần như tài liệu gốc.

­           - Chỉ hình ảnh trang : Tùy chọn này lưu hình ảnh chính xác của trang. Loại tài liệu PDF này gần như không thể phân biệt được với tài liệu gốc nhưng tệp này sẽ không thể tìm kiếm được.

        d. Từ danh sách thả xuống Ảnh, chọn chất lượng ảnh mong muốn.

        e. Chọn PDF hoặc PDF/A.

        f. Nhấp vào nút của tác vụ mà bạn cần:

­   - Quét sang dạng PDF quét tài liệu giấy và chuyển đổi thành PDF

­   - Tệp hình ảnh sang dạng PDF chuyển đổi tệp hình ảnh thành PDF

­   - Ảnh sang dạng PDF chuyển đổi ảnh của tài liệu thành PDF

        g. Kết quả là, tài liệu PDF mới sẽ được tạo và mở trong ứng dụng xem PDF.

       Quan trọng! Khi bạn bắt đầu tác vụ tích hợp, tùy chọn chương trình hiện đã chọn sẽ được sử dụng. Nếu bạn quyết định thay đổi bất kỳ tùy chọn nào, bạn sẽ cần khởi động lại tác vụ.

        h. Gợi ý: Khi lưu văn bản được nhận dạng trong định dạng PDF, bạn có thể chỉ định mật khẩu để bảo vệ tài liệu khỏi bị mở, in và chỉnh sửa trái phép. Để biết chi tiết, xem "Cài đặt bảo mật PDF".

        4/ Các định dạng khác

        Sử dụng tab Khác trong cửa sổ Tác vụ để truy cập các tác vụ tự động hóa tích hợp khác.

        - Từ danh sách thả xuống Ngôn ngữ tài liệu ở đầu cửa sổ, chọn ngôn ngữ tài liệu của bạn.

        - Trong danh sách thả xuống Chế độ màu, chọn chế độ màu đầy đủ hoặc đen trắng.

        -Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu.

        - Nhấp vào nút của tác vụ mà bạn cần
­   
        - Quét sang dạng HTML quét tài liệu giấy và chuyển đổi thành HTM: Hình ảnh hoặc Tệp PDF sang dạng HTML chuyển đổi tài liệu PDF hoặc tệp hình ảnh thành HTML
­   
        - Quét sang dạng EPUB quét tài liệu giấy và chuyển đổi thành EPUB: Hình ảnh hoặc Tệp PDF sang dạng EPUB chuyển đổi tài liệu PDF hoặc tệp hình ảnh thành EPUB

­   - Quét sang Định dạng khác quét tài liệu giấy và chuyển đổi thành định dạng mà bạn chọn: Hình ảnh hoặc Tệp PDF sang Định dạng khác chuyển đổi tài liệu PDF hoặc tệp hình ảnh thành định dạng mà bạn chọn
       
        Kết quả là, tài liệu ABBYY FineReader mới sẽ được tạo chứa văn bản tài liệu gốc của bạn.

        Quan trọng! Khi bạn bắt đầu tác vụ tích hợp, tùy chọn chương trình hiện đã chọn sẽ được sử dụng. Nếu bạn quyết định thay đổi bất kỳ tùy chọn nào, bạn sẽ cần khởi động lại tác vụ.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 15 Tháng Ba, 2017, 07:59:52 AM

        V - XỬ LÝ HÌNH ẢNH

        1/ Quét tài liệu giấy

        Bạn có thể quét tài liệu giấy và nhận dạng hình ảnh thu được trong ABBYY FineReader 12. Hoàn thành các bước sau để quét hình ảnh.

        - Đảm bảo máy quét được kết nối đúng cách với máy tính và bật máy quét: Khi kết nối máy quét với máy tính, thực hiện theo hướng dẫn trong tài liệu hướng dẫn của máy quét hoặc tài liệu đi kèm khác và đảm bảo bạn cài đặt phần mềm đi kèm với máy quét. Một số máy quét phải được bật trước khi bật máy tính kết nối với máy quét.

        - Đặt trang bạn muốn quét trong máy quét. Bạn có thể đặt nhiều trang nếu máy quét của bạn được trang bị khay nạp tài liệu tự động. Cố gắng đảm bảo các trang trong máy quét được đặt càng thẳng càng tốt. Tài liệu có thể được chuyển đổi không chính xác nếu văn bản trên hình ảnh được quét bị nghiêng quá mức.

        - Nhấp vào nút Quét hoặc nhấp vào Quét các trang… trên menu Tệp. Hộp thoại quét sẽ xuất hiện. Chỉ định các cài đặt quét và quét tài liệu. Hình ảnh thu được sẽ hiển thị trên cửa sổ Trang.

        Lưu ý: Nếu tài liệu FineReader đã mở, các trang mới được quét sẽ được thêm vào cuối tài liệu này. Nếu không có tài liệu FineReader đang mở nào, tài liệu mới sẽ được tạo từ các trang này.

        Gợi ý: Nếu bạn cần quét tài liệu được in trên máy in thông thường, sử dụng chế độ thang độ xám và độ phân giải 300 dpi để có kết quả tốt nhất.

        Chất lượng nhận dạng tùy thuộc vào chất lượng của tài liệu bản sao cứng và các cài đặt được sử dụng khi tài liệu được quét. Chất lượng hình ảnh thấp có thể ảnh hưởng xấu đến việc nhận dạng, vì vậy việc chỉ định đúng cài đặt quét và tính đến các đặc điểm của tài liệu nguồn là rất quan trọng.

        Cài đặt độ sáng

        Nếu độ sáng được chỉ định không đúng trong cài đặt quét, một thông báo nhắc bạn thay đổi cài đặt độ sáng sẽ xuất hiện trong khi nhận dạng. Quét một số tài liệu trong chế độ đen trắng có thể cần điều chỉnh thêm độ sáng.

        Hoàn thành các bước sau để thay đổi cài đặt độ sáng:

        - Nhấp vào nút Quét: Chỉ định độ sáng trong hộp thoại mở ra.

        Lưu ý: Cài đặt độ sáng tiêu chuẩn (50%) hoạt động trong hầu hết các trường hợp.

        - Quét hình ảnh: Nếu hình ảnh thu được có nhiều lỗi như các chữ cái lẫn vào nhau hoặc rời nhau, tham khảo bảng bên dưới để biết đề xuất về cách thu được hình ảnh tốt hơn.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY4_zpseunaq2bp.jpg)

        a: Văn bản như thế này sẵn sàng để nhận dạng và không cần thực hiện điều chỉnh nào.

        b: Các ký tự rời nhau, quá sáng và quá mảnh
                  - Giảm độ sáng để làm cho hình ảnh tối hơn
                  - Sử dụng chế độ quét thang độ xám (độ sáng được điều chỉnh tự động trong chế độ này)

        c: Các ký tự lẫn vào nhau và bị biến dạng vì chúng quá tối và dày:
                  - Tăng độ sáng để làm cho hình ảnh sáng hơn
                  - Sử dụng chế độ quét thang độ xám (độ sáng được điều chỉnh tự động trong chế độ này)

        Nên làm gì nếu bạn thấy thông báo nhắc bạn thay đổi độ phân giải

        Chất lượng nhận dạng tùy thuộc vào độ phân giải của hình ảnh tài liệu. Độ phân giải hình ảnh thấp (dưới 150 dpi) có thể có ảnh hưởng xấu đến chất lượng nhận dạng, trong khi hình ảnh có độ phân giải hình ảnh quá cao (trên 600 dpi) không mang lại cải thiện đáng kể nào về chất lượng nhận dạng và mất nhiều thời gian để xử lý.

        Thông báo nhắc bạn thay đổi độ phân giải của hình ảnh có thể xuất hiện nếu:

        - Độ phân giải của hình ảnh dưới 250 dpi hoặc trên 600 dpi.

        - Nếu hình ảnh có độ phân giải phi tiêu chuẩn. Ví dụ: một số ảnh fax có độ phân giải 204 x 96 dpi. Để có kết quả nhận dạng tốt hơn, độ phân giải dọc và ngang của hình ảnh phải như nhau.

        Hoàn thành các bước sau để thay đổi độ phân giải của hình ảnh:

        - Nhấp vào nút Quét.

        - Chọn độ phân giải khác trong hộp thoại quét.

        Lưu ý: Chúng tôi khuyên bạn sử dụng độ phân giải 300dpi cho tài liệu không chứa văn bản nhỏ hơn 10 điểm. Sử dụng độ phân giải từ 400–600 dpi cho văn bản 9 điểm trở xuống.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 20 Tháng Ba, 2017, 03:49:04 PM

        3/ Quét hình ảnh.

        Gợi ý: Bạn cũng có thể sử dụng Biên tập ảnh để thay đổi độ phân giải của hình ảnh. Để mở Biên tập ảnh, trên menu Trang, nhấp vào Chỉnh sửa hình ảnh…

       Quét các trang đối diện: Khi bạn quét các trang đối diện của một cuốn sách, cả hai trang sẽ xuất hiện trên cùng một hình ảnh.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY5_zpsdansdnuo.jpg)

        Để cải thiện chất lượng OCR, hình ảnh có các trang đối diện sẽ cần phải tách thành hai hình ảnh riêng biệt. ABBYY FineReader 12 có một chế độ đặc biệt tự động tách các hình ảnh như vậy thành các trang riêng biệt trong tài liệu FineReader.

        Thực hiện theo hướng dẫn bên dưới để quét các trang đối diện từ một cuốn sách hoặc các trang kép.

        - Mở hộp thoại Tùy chọn (Công cụ >Tùy chọn…) và nhấp vào tab Quét/Mở.

        - Chọn tùy chọn Tách các trang đối diện trong nhóm Xử lý chung.

        Lưu ý: Để có kết quả tốt nhất, đảm bảo các trang được đặt đúng hướng khi bạn quét và bật tùy chọn Phát hiện hướng trang trong tab Quét/Mở của hộp thoại Tùy chọn.

        - Quét các trang đối diện: Bạn cũng có thể truy cập cài đặt xử lý tự động bằng cách nhấp vào nút Tùy chọn… trong hộp thoại Mở hình ảnh (Tệp >Mở tệp PDF hoặc hình ảnh…) hoặc hộp thoại quét.

        - Bạn cũng có thể tách các trang đối diện thủ công:

                + Mở Biên tập ảnh (Trang > Chỉnh sửa hình ảnh…).

                + Sử dụng các công cụ trong nhóm Tách để tách hình ảnh.

        4/ Chụp ảnh tài liệu

        Quét không phải là cách duy nhất để thu được hình ảnh tài liệu của bạn. Bạn có thể nhận dạng ảnh của tài liệu được chụp bằng máy ảnh hoặc điện thoại di động. Chỉ cần chụp ảnh văn bản, lưu vào ổ cứng của bạn và mở trong ABBYY FineReader.

        a. Yêu cầu về máy ảnh: Máy ảnh của bạn phải đáp ứng các yêu cầu sau đây để có được các hình ảnh tài liệu có thể được nhận dạng một cách đáng tin cậy.

        Đặc điểm máy ảnh đề xuất

        - Cảm biến hình ảnh: 5 triệu pixel cho trang A4. Các cảm biến nhỏ hơn có thể đủ để chụp ảnh các tài liệu nhỏ hơn, chẳng hạn như danh thiếp.

        - Tính năng tắt flash

        - Điều khiển khẩu độ thủ công, nghĩa là, có chế độ Av hoặc chế độ thủ công hoàn toàn

        - Lấy nét thủ công

        - Một hệ thống chống rung hoặc khả năng sử dụng giá ba chân

        - Thu phóng quang học

        Yêu cầu tối thiểu

        - 2 triệu pixel đối với trang A4.

        - Tiêu cự thay đổi.

        Lưu ý: Để biết thông tin chi tiết về máy ảnh của bạn, vui lòng tham khảo tài liệu đi kèm với thiết bị của bạn.

        b. Ánh sáng: Ánh sáng ảnh hưởng lớn đến chất lượng của ảnh thu được. Có thể đạt được kết quả tốt nhất với ánh sáng phân bố đều và sáng, tốt nhất là ánh sáng ban ngày. Vào ngày nắng nhẹ, bạn có thể tăng số khẩu độ lên để chụp ảnh sắc nét hơn.

        Sử dụng đèn flash và các nguồn ánh sáng bổ sung:
 
        - Khi sử dụng ánh sáng nhân tạo, sử dụng hai nguồn sáng được đặt sao cho tránh bị bóng hoặc lóa.

        - Nếu có đủ ánh sáng, tắt flash để ngăn các điểm sáng và điểm tối mạnh. Khi sử dụng đèn flash ở điều kiện ánh sáng yếu, hãy nhớ chụp ảnh từ khoảng cách khoảng 50 cm.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 21 Tháng Ba, 2017, 12:45:46 AM

        Quan trọng! Không được sử dụng đèn flash để chụp ảnh các tài liệu in trên giấy bóng. So sánh hình ảnh với ánh sáng và hình ảnh có chất lượng tốt

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY6_zps6kxowoyb.jpg)

       a: Với giấy có độ bóng, dùng flash khi chụp sẽ cho kết quả nhận dạng kết quả rất kém

       b: Không dùng flash cho kết quả tốt hơn

        Nếu hình ảnh quá tối:
 
        - Đặt giá trị khẩu độ thấp hơn để mở khẩu độ.

        - Đặt giá trị ISO cao hơn.

        - Sử dụng lấy nét thủ công, vì lấy nét tự động có thể thất bại trong điều kiện ánh sáng kém.

        So sánh hình ảnh quá tối (a) và hình ảnh có chất lượng tốt (b):

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY7_zpstddldwjz.jpg)

        c. Chụp ảnh

        Để có ảnh của tài liệu có chất lượng tốt, đảm bảo đặt máy ảnh đúng và thực hiện theo những đề xuất đơn giản sau.

        - Sử dụng giá ba chân mỗi khi có thể.

        - Thấu kính được đặt song song với trang. Phải chọn khoảng cách giữa máy ảnh và tài liệu sao cho toàn bộ trang vừa với khung khi bạn phóng to. Trong hầu hết các trường hợp, khoảng cách này sẽ từ 50 đến 60 cm.

        - Trải phẳng tài liệu giấy hoặc các trang sách (nhất là các cuốn sách dày). Dòng văn bản không được nghiêng quá 20 độ, nếu không văn bản không thể được chuyển đổi đúng.

        - Để có hình ảnh sắc nét hơn, hãy lấy nét vào tâm hình ảnh:

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY8_zpsj4cf48e8.jpg)

        - Bật hệ thống chống rung, vì phơi sáng lâu hơn trong điều kiện ánh sáng yếu có thể gây ra mờ.

        - Sử dụng tính năng nhả cửa sập tự động. Tính năng này sẽ ngăn máy ảnh di chuyển khi bạn bấm nút nhả cửa sập. Bạn nên sử dụng tính năng nhả cửa sập tự động ngay cả khi bạn sử dụng giá ba chân.

        d. Cách cải thiện hình ảnh nếu:

        - Hình ảnh quá tối hoặc độ tương phản quá thấp: Giải pháp: Thử cải thiện ánh sáng. Nếu đây không phải một tùy chọn, thử đặt giá trị khẩu độ thấp hơn.

        - Hình ảnh không đủ sắc nét: Giải pháp: Lấy nét tự động có thể không hoạt động tốt ở điều kiện ánh sáng yếu hoặc khi chụp ảnh từ khoảng cách gần. Thử sử dụng ánh sáng sáng hơn. Sử dụng giá ba chân và bộ hẹn giờ tự chụp để tránh di chuyển máy ảnh khi chụp ảnh. Nếu hình ảnh chỉ hơi mờ, hãy thử công cụ Sửa ảnh sẵn có trong Biên tập ảnh. Để biết thêm thông tin, xem "Chỉnh sửa hình ảnh thủ công".

        - Một phần của hình ảnh không đủ sắc nét: Giải pháp: Thử đặt giá trị khẩu độ cao hơn. Chụp ảnh từ khoảng cách xa hơn ở mức thu phóng quang học tối đa. Tập trung vào một điểm giữa tâm và cạnh của hình ảnh.

        - Đèn flash gây lóa: Giải pháp: Tắt đèn flash hoặc thử sử dụng nguồn ánh sáng khác và tăng khoảng cách giữa máy ảnh và tài liệu.



Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 23 Tháng Ba, 2017, 05:08:57 AM

        5/ Mở hình ảnh hoặc tài liệu PDF

        ABBYY FineReader 12 cho phép bạn mở tệp PDF và tệp hình ảnh trong các định dạng được hỗ trợ.

        Hoàn thành các bước sau để mở tệp PDF hoặc tệp hình ảnh:

­        - Nhấp vào nút Mở trên thanh công cụ chính hoặc nhấp vào Mở tệp PDF hoặc hình ảnh… trên menu Tệp.

­­        - Chọn một hoặc nhiều tệp từ hộp thoại mở ra. Nếu bạn chọn tệp có nhiều trang, bạn có thể chỉ định phạm vi trang bạn muốn mở.

­­        - Bật tùy chọn Tự động xử lý các trang khi chúng được thêm vào nếu bạn muốn tự động xử lý sơ bộ ảnh.

­        Gợi ý: Hộp thoại Tùy chọn cho phép bạn chọn cách xử lý sơ bộ ảnh: lỗi nào sẽ được xóa bỏ, tài liệu sẽ được phân tích hay không, v.v.. Để mở hộp thoại Tùy chọn, nhấp vào nút Tùy chọn…. Để biết thêm về cài đặt xử lý sơ bộ, xem " Các tùy chọn quét và mở".

        Lưu ý: Nếu có tài liệu FineReader đang mở khi bạn mở hình ảnh trang hoặc tài liệu mới, các trang mới sẽ được thêm vào cuối tài liệu FineReader này. Nếu không có tài liệu FineReader nào đang mở, một tài liệu mới sẽ được tạo từ các trang mới.

         Bạn có thể tìm thêm thông tin về tài liệu FineReader và các trang trong phần "Tài liệu FineReader là gì?".

        Lưu ý: Quyền truy cập vào một số tài liệu PDF bị tác giả của tài liệu hạn chế. Những hạn chế này bao gồm bảo vệ bằng mật khẩu, hạn chế mở tài liệu và hạn chế sao chép nội dung. Khi mở những tệp này, ABBYY FineReader có thể yêu cầu mật khẩu.

        Các tùy chọn quét và mở

        Để tùy chỉnh quá trình quét và mở các trang trong ABBYY FineReader, bạn có thể:

        - Bật/tắt tự động phân tích và nhận dạng các trang mới được thêm vào
        - Chọn các tùy chọn xử lý sơ bộ ảnh khác nhau

        - Chọn giao diện quét

        Bạn có thể truy cập những cài đặt này từ các hộp thoại cho mở và quét tài liệu (nếu bạn đang sử dụng giao diện quét của ABBYY FineReader 12) và trên tab Quét/Mở của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

        Quan trọng! Mọi thay đổi bạn thực hiện trong hộp thoại Tùy chọn sẽ chỉ được áp dụng cho hình ảnh mới được quét/mở.

        Tab Quét/Mở của hộp thoại Tùy chọn có các tùy chọn sau:

        Cài đặt tự động phân tích và nhận dạng

        Theo mặc định, tài liệu FineReader được phân tích và nhận dạng tự động, nhưng bạn có thể thay đổi cách xử lý này. Hiện có các chế độ sau:

           + Đọc hình ảnh trang (bao gồm tiền xử lý hình ảnh): Mọi hình ảnh được thêm vào tài liệu FineReader được xử lý sơ bộ tự động sử dụng các cài đặt từ nhóm tùy chọn Xử lý hình ảnh. Phân tích và nhận dạng cũng được thực hiện tự động.

                + Phân tích hình ảnh trang (bao gồm tiền xử lý hình ảnh): Xử lý sơ bộ ảnh và phân tích tài liệu được thực hiện tự động, nhưng nhận dạng phải được bắt đầu thủ công.

           + Tiền xử lý hình ảnh trang: Chỉ xử lý sơ bộ được thực hiện tự động. Phân tích và nhận dạng phải được bắt đầu bằng tay. Chế độ này thường được sử dụng cho các tài liệu có cấu trúc phức tạp.

        Nếu bạn không muốn hình ảnh bạn thêm vào tài liệu FineReader được xử lý tự động, bỏ chọn Tự động xử lý các trang khi chúng được thêm vào. Tùy chọn này cho phép bạn mở nhanh các tài liệu lớn, chỉ nhận dạng các trang nhất định trong tài liệu và lưu tài liệu dưới dạng hình ảnh.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 23 Tháng Ba, 2017, 02:02:42 PM
       
        6/ Các tùy chọn xử lý sơ bộ ảnh

        ABBYY FineReader 12 cho phép bạn tự động xóa bỏ các lỗi ảnh quét và ảnh kỹ thuật số phổ biến.

        Xử lý chung

        - Tách các trang đối diện: Chương trình sẽ tự động tách hình ảnh chứa các trang đối diện thành hai hình ảnh chứa từng trang.

        - Phát hiện hướng trang: Hướng của các trang được thêm vào tài liệu FineReader sẽ được phát hiện tự động và sửa nếu cần.

        - Chỉnh ảnh nghiêng: Các trang bị nghiêng sẽ được phát hiện tự động và chỉnh ảnh nghiêng nếu cần.

        - Sửa biến dạng hình thang: Chương trình sẽ tự động phát hiện biến dạng hình thang và dòng văn bản không đều trên ảnh kỹ thuật số và ảnh quét của sách. Những lỗi này sẽ được sửa khi thích hợp.

        - Sửa thẳng các dòng văn bản: Chương trình sẽ tự động phát hiện các dòng văn bản không đều trên hình ảnh và nắn thẳng mà không sửa biến dạng hình thang.

        - Đảo ngược hình ảnh: Khi thích hợp, ABBYY FineReader 12 sẽ đảo ngược màu hình ảnh sao cho hình ảnh chứa văn bản tối trên nền sáng.

        - Xóa dấu màu: Chương trình sẽ phát hiện và xóa bất kỳ nhãn màu hoặc dấu màu nào được thực hiện bằng bút để hỗ trợ nhận dạng văn bản bị che bởi các dấu này. Công cụ này được thiết kế cho các tài liệu được quét có văn bản tối trên nền trắng. Không chọn tùy chọn này cho ảnh và tài liệu kỹ thuật số có nền màu.

        - Sửa độ phân giải hình ảnh: ABBYY FineReader 12 sẽ tự động phát hiện độ phân giải tốt nhất cho hình ảnh và sẽ thay đổi độ phân giải của hình ảnh khi cần.

        Sửa ảnh

        - Phát hiện cạnh trang: Đôi khi, ảnh kỹ thuật số có các đường viền không chứa dữ liệu hữu ích nào. Chương trình sẽ phát hiện những đường viền này và xóa chúng.

        - Làm trắng nền: ABBYY FineReader sẽ làm trắng nền và chọn độ sáng tốt nhất cho hình ảnh.

        - Giảm nhiễu ISO: Nhiễu sẽ tự động được khử khỏi ảnh chụp.

        - Xóa mờ do chuyển động: Độ sắc nét của ảnh kỹ thuật số bị mờ sẽ được nâng cao.

        Lưu ý: Bạn có thể tắt tất cả những tùy chọn này khi quét hoặc mở các trang tài liệu và vẫn áp dụng bất kỳ tính năng xử lý sơ bộ mong muốn nào trong Biên tập ảnh. Để biết chi tiết, xem "Xử lý sơ bộ ảnh".

        Quét giao diện


        Theo mặc định, ABBYY FineReader sử dụng giao diện quét riêng. Hộp thoại quét có các tùy chọn sau:

        - Độ phân giải, Chế độ quét và Độ sáng.

        - Cài đặt giấy.

        - Xử lý hình ảnh.

        Gợi ý: Bạn có thể chọn bật tính năng xử lý sơ bộ nào, lỗi nào sẽ được xóa bỏ và tài liệu có được tự động phân tích và nhận dạng hay không. Để làm như vậy, bật tùy chọn Tự động xử lý các trang khi chúng được thêm vào và nhấp vào nút Tùy chọn….

        - Quét nhiều trang:

           + Sử dụng khay nạp tài liệu tự động (ADF)

           + Quét hai mặt

           + Đặt thời gian hẹn giờ quét trang tính bằng giây

        Nếu giao diện quét của ABBYY FineReader 12 không tương thích với máy quét của bạn, bạn có thể sử dụng giao diện nguyên bản của máy quét. Tài liệu của máy quét sẽ chứa mô tả về hộp thoại này và các thành phần trong hộp thoại.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 25 Tháng Ba, 2017, 08:09:38 AM
        
       Xử lý sơ bộ ảnh tự động

        Các dòng văn bản bị biến dạng, nghiêng, nhiễu và các lỗi khác thường thấy trên hình ảnh quét và ảnh kỹ thuật số có thể làm giảm chất lượng nhận dạng. ABBYY FineReader có thể xóa bỏ những lỗi này tự động và cũng cho phép bạn xóa bỏ chúng thủ công.

        ABBYY FineReader có một vài tính năng xử lý sơ bộ ảnh. Nếu những tính năng này được bật, chương trình tự động xác định cách cải thiện hình ảnh dựa trên loại hình ảnh và áp dụng mọi tính năng tăng cường ảnh cần thiết: khử nhiễu, sửa nghiêng, nắn thẳng dòng văn bản và sửa biến dạng hình thang.

        Lưu ý: Những thao tác này có thể mất thời gian đáng kể.

        Hoàn thành các bước bên dưới nếu bạn muốn ABBYY FineReader 12 tự động xử lý sơ bộ tất cả ảnh được mở hoặc quét.

        - Mở hộp thoại Tùy chọn (Công cụ >Tùy chọn…).

        - Nhấp vào tab Quét/Mở và đảm bảo tùy chọn Tự động xử lý các trang khi chúng được thêm vào trong nhóm Chung được bật và các tùy chọn cần thiết được chọn trong nhóm Xử lý sơ bộ ảnh.

        Lưu ý: Bạn cũng có thể bật và tắt xử lý sơ bộ ảnh tự động trong hộp thoại Mở hình ảnh (Tệp >Mở tệp PDF hoặc hình ảnh…) và trong hộp thoại quét.

        Chỉnh sửa hình ảnh thủ công: Bạn có thể tắt xử lý sơ bộ tự động và chỉnh sửa hình ảnh thủ công trong Biên tập ảnh. Làm theo hướng dẫn bên dưới để chỉnh sửa hình ảnh thủ công:

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY9_zpsb4lwjmtu.jpg)



        - Mở Biên tập ảnh bằng cách nhấp vào Chỉnh sửa hình ảnh… trên menu Trang (xem hình trên). Phần bên trái của TRÌNH BIÊN TẬP HÌNH ẢNH chứa trang của tài liệu FineReader được chọn khi bạn mở Biên tập ảnh. Phần bên phải chứa nhiều tab với các công cụ để chỉnh sửa hình ảnh.

        - Chọn một công cụ và thực hiện các thay đổi mong muốn. Hầu hết các công cụ có thể được áp dụng cho các trang đã chọn hoặc cho tất cả các trang trong tài liệu. Bạn có thể chọn các trang sử dụng danh sách thả xuống Lựa chọn hoặc trong cửa sổ Trang.

        - Nhấp vào nút Thoát Trình biên tập hình ảnh sau khi bạn đã hoàn thành chỉnh sửa hình ảnh.

        Biên tập ảnh có chứa các công cụ sau:

        - Tiền xử lý được đề xuất Chương trình tự động xác định cần thực hiện điều chỉnh nào đối với hình ảnh. Các điều chỉnh có thể áp dụng bao gồm khử nhiễu và xóa mờ, đảo ngược màu để làm cho màu nền sáng, sửa nghiêng, nắn thẳng các dòng văn bản, sửa biến dạng hình thang và cắt đường viền hình ảnh.

        - Xử lý ảnh nghiêng Sửa nghiêng hình ảnh.

        - Làm thẳng dòng văn bản Nắn thẳng mọi dòng văn bản bị cong trên hình ảnh.

        - Sửa ảnh Các công cụ trong nhóm này cho phép bạn nắn thẳng các dòng văn bản, khử nhiễu và xóa mờ và biến màu nền của tài liệu thành màu trắng.

        - Sửa biến dạng hình thang Sửa biến dạng hình thang và xóa bỏ các cạnh của hình ảnh không chứa dữ liệu hữu ích nào. Khi công cụ này được chọn, một lưới màu xanh xuất hiện trên hình ảnh. Kéo các góc của lưới đến các góc của hình ảnh. Nếu bạn làm đúng thao tác này, các đường nằm ngang của lưới sẽ song song với các dòng văn bản. Bây giờ, nhấp vào nút Sửa.

        - Xoay và lật Các công cụ trong nhóm này cho phép bạn xoay hình ảnh và lật chúng theo chiều dọc hoặc ngang để văn bản trên hình ảnh hướng theo góc vuông.

        - Tách Các công cụ trong nhóm này cho phép bạn tách hình ảnh thành các phần. Điều này có thể hữu ích nếu bạn đang quét một cuốn sách và cần tách các trang đối diện.

        - Xén Xóa bỏ các cạnh của hình ảnh không chứa dữ liệu hữu ích.

        - Đảo ngược Đảo ngược màu hình ảnh. Điều này có thể hữu ích nếu bạn đang xử lý màu sắc văn bản phi tiêu chuẩn (văn bản sáng màu trên nền tối).

        - Độ phân giải Thay đổi độ phân giải hình ảnh.

        - Độ sáng và độ tương phản Thay đổi độ sáng và độ tương phản của hình ảnh.

        - Cấp Công cụ này cho phép bạn điều chỉnh các mức màu sắc của hình ảnh bằng cách thay đổi cường độ của điểm tối, điểm sáng và bán sắc.
Để tăng độ tương phản của hình ảnh, di chuyển thanh trượt trái và phải trên biểu đồ Cấp đầu vào. Thanh trượt trái thiết lập màu sẽ được coi là phần tối nhất của hình ảnh và thanh trượt phải thiết lập màu sẽ được coi là phần sáng nhất của hình ảnh. Di chuyển thanh trượt ở giữa sang phải sẽ làm tối hình ảnh và di chuyển sang trái sẽ làm sáng hình ảnh.
Điều chỉnh thanh trượt mức đầu ra để giảm độ tương phản của hình ảnh.

        - Tẩy Xóa bỏ một phần hình ảnh.

        - Xóa dấu màu Xóa bất kỳ nhãn màu hoặc dấu màu nào được thực hiện bằng bút để hỗ trợ nhận dạng văn bản bị che bởi các dấu này. Công cụ này được thiết kế cho các tài liệu được quét có văn bản tối trên nền trắng. Không sử dụng công cụ này cho ảnh và tài liệu kỹ thuật số có nền màu.

        7/ Thêm ảnh mà không xử lý

        Bạn có thể sử dụng các tác vụ tự động hóa Quét nhanh, Mở nhanh hoặc Quét và lưu dưới dạng hình ảnh trong cửa sổ Tác vụ để quét hoặc mở hình ảnh trong ABBYY FineReader mà không xử lý sơ bộ hoặc OCR. Điều này có thể hữu ích nếu bạn có tài liệu rất lớn và chỉ cần nhận dạng một số trang của tài liệu.

         Để biết chi tiết, xem "Sao chép nội dung từ tài liệu" và "Lưu hình ảnh của trang".

        - Trong danh sách thả xuống Chế độ màu, chọn chế độ màu đầy đủ hoặc đen trắng. Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu.

        - Nhấp vào tác vụ tự động hóa mà bạn cần:
 
           + Quét nhanh quét tài liệu giấy và mở hình ảnh trong ABBYY FineReader mà không xử lý sơ bộ ảnh hoặc OCR

           + Mở nhanh, mở tài liệu PDF và tệp hình ảnh trong ABBYY FineReader mà không xử lý sơ bộ ảnh hoặc OCR

           + Quét và lưu dưới dạng hình ảnh quét tài liệu và lưu ảnh quét. Sau khi hoàn thành quét, hộp thoại lưu hình ảnh sẽ mở ra.

        Để biết danh sách các định dạng tệp mà bạn có thể lưu hình ảnh được quét, xem "Các định dạng hình ảnh được hỗ trợ".

        Kết quả, hình ảnh sẽ được thêm vào tài liệu ABBYY FineReader mới hoặc được lưu vào thư mục mà bạn chọn.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 26 Tháng Ba, 2017, 11:14:14 PM
        
       VI - NHẬN DẠNG TÀI LIỆU

        ABBYY FineReader sử dụng công nghệ Nhận dạng ký tự quang học để chuyển đổi hình ảnh tài liệu thành văn bản có thể chỉnh sửa. Trước khi thực hiện OCR, chương trình phân tích cấu trúc của toàn bộ tài liệu và phát hiện các vùng chứa văn bản, mã vạch, hình ảnh và bảng. Chất lượng OCR có thể được cải thiện bằng cách chọn đúng ngôn ngữ tài liệu, chế độ đọc và kiểu in trước khi nhận dạng.

        Theo mặc định, tài liệu ABBYY FineReader được nhận dạng tự động. Cài đặt chương trình hiện hành được sử dụng cho nhận dạng tự động.

        Gợi ý: Bạn có thể tắt phân tích và OCR tự động cho các hình ảnh mới được thêm trong Quét/Mở của hộp thoại Tùy chọn (Công cụ>Tùy chọn…).

        Trong một số trường hợp, quá trình OCR có thể được bắt đầu thủ công. Ví dụ, nếu bạn đã tắt nhận dạng tự động, chọn thủ công các vùng trên hình ảnh, hoặc thay đổi các cài đặt sau đây trong hộp thoại Tùy chọn (Công cụ > Tùy chọn…):

        - Ngôn ngữ nhận dạng trên tab Tài liệu

        - Loại tài liệu trên tab Tài liệu

        - Chế độ màu trên tab Tài liệu

        - Các tùy chọn nhận dạng trên tab Đọc

        - Phông chữ được sử dụng trên tab Đọc

        Để khởi chạy thủ công quá trình OCR:

        - Nhấp vào nút Đọc trên thanh công cụ chính, hoặc

        -  Nhấp vào Đọc tài liệu trên menu Tài liệu

        Gợi ý: Để nhận dạng vùng hoặc trang đã chọn, sử dụng các tùy chọn thích hợp trên menu Trang và Vùng hoặc sử dụng menu chuột phải.

        1/ Tài liệu FineReader là gì?

        Khi làm việc với chương trình, bạn có thể lưu kết quả tạm thời trong tài liệu FineReader để bạn có thể tiếp tục công việc của mình ở nơi bạn dừng lại. Tài liệu FineReader chứa hình ảnh nguồn, văn bản đã được nhận dạng trong hình ảnh, các cài đặt chương trình của bạn và bất kỳ mẫu người dùng, ngôn ngữ hoặc nhóm ngôn ngữ nào mà bạn đã tạo để nhận dạng văn bản trong hình ảnh.

         a. Mở tài liệu FineReader: Khi bạn khởi động ABBYY FineReader, một tài liệu FineReader mới được tạo. Bạn có thể sử dụng tài liệu này hoặc mở tài liệu hiện có.

        Để mở tài liệu FineReader hiện có:

        - Trên menu Tệp, nhấp vào Mở tài liệu FineReader…

        - Chọn tài liệu mong muốn trong hộp thoại mở ra.

        Lưu ý: Khi bạn mở tài liệu FineReader được tạo trong phiên bản trước của chương trình, ABBYY FineReader sẽ cố gắng chuyển đổi tài liệu về phiên bản hiện tại của định dạng tài liệu FineReader. Quá trình này không thể đảo ngược và bạn sẽ được nhắc lưu tài liệu đã chuyển đổi trong tên khác. Văn bản được nhận dạng từ tài liệu cũ sẽ không được chuyển sang tài liệu mới.

        Gợi ý: Nếu bạn muốn mở tài liệu bạn đã làm việc lần trước khi bạn khởi động ABBYY FineReader, chọn tùy chọn Mở tài liệu FineReader được sử dụng mới nhất khi chương trình khởi động trên tab Nâng cao của hộp thoại Tùy chọn (nhấp vào Công cụ > Tùy chọn… để mở hộp thoại).

        Bạn cũng có thể mở tài liệu FineReader từ Windows Explorer bằng cách nhấp chuột phải vào tài liệu rồi nhấp Mở bằng ABBYY FineReader 12. Tài liệu FineReader có biểu tượng  

        b. Thêm hình ảnh vào tài liệu FineReader

        - Trên menu Tệp, nhấp Mở tệp PDF hoặc hình ảnh…

        - Chọn một hoặc nhiều tệp hình ảnh trong hộp thoại mở ra và nhấp vào Mở. Hình ảnh sẽ được thêm vào cuối tài liệu FineReader đang mở và bản sao của hình ảnh sẽ được lưu trong thư mục của tài liệu.

        Bạn cũng có thể thêm hình ảnh từ Windows Explorer vào tài liệu FineReader. Nhấp chuột phải vào hình ảnh trong Windows Explorer rồi nhấp vào Mở bằng ABBYY FineReader trên menu chuột phải. Nếu tài liệu FineReader đã mở khi bạn làm như vậy, hình ảnh sẽ được thêm vào cuối tài liệu này. Nếu bạn không gặp trường hợp này, một tài liệu FineReader mới sẽ được tạo từ hình ảnh.

        Ảnh quét cũng có thể được thêm vào. Để biết chi tiết, xem "Quét tài liệu giấy".


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 28 Tháng Ba, 2017, 06:42:38 PM
       
        c. Xóa một trang khỏi tài liệu

        - Chọn một trang trong cửa sổ Trang rồi bấm phím Xóa hoặc

        - Trên menu Trang, nhấp vào Xóa trang khỏi tài liệu hoặc

        - Nhấp chuột phải vào trang đã chọn và nhấp Xóa trang khỏi tài liệu. Bạn có thể chọn và xóa nhiều trang trong cửa sổ Trang.

        d. Lưu tài liệu

        - Trên menu Tệp, nhấp Lưu tài liệu FineReader…

        - Chỉ định đường dẫn đến thư mục mà bạn muốn lưu tài liệu và tên của tài liệu trong hộp thoại mở ra.

        Quan trọng! Khi bạn lưu tài liệu ABBYY FineReader, mọi mẫu người dùng và ngôn ngữ đã được tạo khi bạn làm việc với tài liệu này được lưu cùng với hình ảnh trang và văn bản.

        e. Đóng tài liệu

        - Để đóng một trang tài liệu, nhấp vào Đóng trang hiện tại trên menu Tài liệu.

        - Để đóng toàn bộ tài liệu, nhấp Đóng tài liệu FineReader từ menu Tệp.

        f. Tách tài liệu FineReader: Khi xử lý số lượng lớn các tài liệu nhiều trang, thông thường sẽ thực tế hơn khi quét tất cả tài liệu trước rồi sau đó mới phân tích và nhận dạng chúng. Tuy nhiên, để giữ nguyên định dạng gốc của từng tài liệu giấy một cách chính xác, ABBYY FineReader phải xử lý từng tài liệu dưới dạng một tài liệu FineReader riêng. ABBYY FineReader bao gồm các công cụ để nhóm các trang được quét thành các tài liệu riêng biệt.

        Để tách một tài liệu ABBYY FineReader thành một vài tài liệu:

        - Trên menu Tệp, nhấp vào Tách Tài liệu FineReader… hoặc chọn các trang trong ngăn Trang, nhấp chuột phải vào lựa chọn rồi nhấp vào Di chuyển các trang sang tài liệu mới…

        - Trong hộp thoại mở ra, tạo số lượng tài liệu cần thiết bằng cách nhấp vào nút Thêm tài liệu.

        - Di chuyển các trang từ cửa sổ Trang vào các tài liệu thích hợp của chúng được hiển thị trong ngăn Tài liệu mới sử dụng một trong ba phương thức sau:

           + Chọn trang và dùng chuột để kéo trang; Lưu ý: Bạn cũng có thể sử dụng kéo và thả để di chuyển trang giữa các tài liệu.

           + Nhấp vào nút Di chuyển để di chuyển các trang đã chọn vào tài liệu hiện tại được hiển thị trong ngăn Tài liệu mới hoặc nhấp vào nút Trả lại để đưa các trang quay lại cửa sổ Trang.

           + Sử dụng phím tắt: bấm Ctrl+Mũi tên phải để di chuyển các trang đã chọn từ cửa sổ Trang đến tài liệu đã chọn trong ngăn Tài liệu mới và Ctrl+Mũi tên trái hoặc Delete để đưa chúng quay lại.

        - Khi bạn đã hoàn thành việc di chuyển trang vào tài liệu FineReader mới, nhấp vào nút Tạo tất cả để tạo đồng thời tất cả tài liệu hoặc nhấp vào nút Tạo trong từng tài liệu riêng biệt.
        Gợi ý: Bạn cũng có thể kéo và thả các trang đã chọn từ ngăn Trang vào bất kỳ cửa sổ ABBYY FineReader nào khác. Một tài liệu ABBYY FineReader mới sẽ được tạo cho các trang này.

        g. Sắp xếp thứ tự các trang trong tài liệu FineReader

        - Chọn một hoặc nhiều trang trong cửa sổ Trang.

        - Nhấp chuột phải vào lựa chọn rồi nhấp vào Xếp lại thứ tự trang… trên menu chuột phải.
 
       - Trong hộp thoại Xếp lại thứ tự trang, chọn một trong các tùy chọn sau:

           + Xếp lại thứ tự trang (không thể hoàn tác): Thao tác này sẽ thay đổi tất cả số trang một cách lần lượt, bắt đầu với trang được chọn.

           + Khôi phục thứ tự trang gốc sau khi quét hai mặt: Tùy chọn này khôi phục đánh số trang ban đầu của tài liệu có các trang hai mặt nếu bạn sử dụng máy quét có khay nạp giấy tự động để quét tất cả các trang đánh số lẻ trước rồi đến tất cả các trang đánh số chẵn. Bạn có thể chọn thứ tự bình thường và đảo ngược cho các trang đánh số chẵn.

        Quan trọng! Tùy chọn này sẽ chỉ hoạt động nếu từ 3 trang được đánh số liên tiếp trở lên được chọn.

           + Đổi trang sách: Tùy chọn này hữu ích nếu bạn quét một cuốn sách viết bằng chữ viết từ trái sang phải và tách các trang đối diện nhưng không chỉ định được ngôn ngữ chính xác.

        Quan trọng! Tùy chọn này sẽ chỉ hoạt động cho từ 2 trang được đánh số liên tiếp trở lên, bao gồm ít nhất 2 trang đối diện. Ghi chú: Để hủy thao tác này, chọn Hoàn tác thao tác cuối.

         Nhấp vào OK.

         Thứ tự của các trang trong cửa sổ Trang sẽ thay đổi để thể hiện cách đánh số mới.

         Lưu ý:

           + Để thay đổi số của một trang, nhấp vào số của trang này trong cửa sổ Trang và nhập số mới vào trường.

           + Ở chế độ Hình thu nhỏ, bạn có thể thay đổi cách đánh số trang chỉ bằng cách kéo các trang đã chọn tới vị trí mong muốn trong tài liệu.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 31 Tháng Ba, 2017, 11:05:28 AM
         
        h. Thuộc tính tài liệu

        Thuộc tính tài liệu chứa thông tin về tài liệu (tiêu đề mở rộng của tài liệu, tác giả, chủ đề, từ khóa, v.v..). Thuộc tính tài liệu có thể được sử dụng để sắp xếp tệp của bạn. Ngoài ra, bạn có thể tìm kiếm tài liệu theo thuộc tính của chúng và chỉnh sửa thuộc tính của tài liệu.

        Khi nhận dạng tài liệu PDF và các loại tệp hình ảnh nhất định, ABBYY FineReader sẽ kết xuất thuộc tính của tài liệu nguồn. Sau đó, bạn có thể chỉnh sửa các thuộc tính này.

        Để thêm hoặc sửa đổi thuộc tính tài liệu:

        - Nhấp vào Công cụ > Tùy chọn…

        - Nhấp vào tab Tài liệu và trong nhóm Thuộc tính tài liệu, chỉ định tiêu đề, tác giả, chủ đề và từ khóa.

        i. Mẫu và ngôn ngữ

        Bạn có thể lưu cài đặt mẫu và ngôn ngữ và tải cài đặt từ tệp.

         Để biết thêm về mẫu, xem "Nếu tài liệu in của bạn chứa phông chữ phi tiêu chuẩn". Phần "Nếu chương trình không nhận dạng được một số ký tự" giải thích cách sử dụng ngôn ngữ người dùng.

        Để lưu mẫu và ngôn ngữ vào một tệp:

        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.

        - Trong Mẫu người dùng và ngôn ngữ, nhấp vào nút Lưu vào tệp….

        - Trong hộp thoại mở ra, nhập tên cho tệp của bạn và chỉ định nơi lưu trữ. Tệp này sẽ chứa đường dẫn tới thư mục lưu trữ ngôn ngữ người dùng, nhóm ngôn ngữ, từ điển và mẫu.

        Để tải mẫu và ngôn ngữ:

        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.

        - Trong Mẫu người dùng và ngôn ngữ, nhấp vào nút Tải từ tệp….

        - Trong hộp thoại Tùy chọn tải, chọn tệp có chứa ngôn ngữ và mẫu người dùng mong muốn (tệp phải có phần mở rộng là *.fbt) và nhấp vào Mở.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 01 Tháng Tư, 2017, 07:59:31 PM
      
       2/ Các tính năng của tài liệu cần xem xét trước khi OCR

        a. Ngôn ngữ tài liệu

        ABBYY FineReader nhận dạng cả tài liệu đơn ngữ và đa ngữ (nghĩa là được viết bằng hai hoặc nhiều ngôn ngữ). Đối với tài liệu đa ngữ, bạn cần chọn một số ngôn ngữ nhận dạng.

        Để chỉ định ngôn ngữ OCR cho tài liệu của bạn, trong danh sách thả xuống Ngôn ngữ tài liệu trên thanh công cụ chính hoặc trong cửa sổ Tác vụ, chọn một trong các tùy chọn sau:

­        - Tự động chọn: ABBYY FineReader sẽ tự động chọn ngôn ngữ phù hợp từ danh sách ngôn ngữ do người dùng xác định. Để sửa đổi danh sách này:

       + Chọn Ngôn ngữ khác…

           * Trong hộp thoại Trình biên tập ngôn ngữ, chọn tùy chọn Tự động chọn ngôn ngữ cho tài liệu từ danh sách sau.

           * Nhấp vào nút Chỉ định….

           * Trong hộp thoại Ngôn ngữ, chọn các ngôn ngữ mong muốn.

­       + Một ngôn ngữ hoặc kết hợp các ngôn ngữ: Chọn một ngôn ngữ hoặc kết hợp các ngôn ngữ. Danh sách ngôn ngữ bao gồm các ngôn ngữ nhận dạng được sử dụng gần đây, cũng như Tiếng Anh, Tiếng Đức và Tiếng Pháp.

­        + Ngôn ngữ khác…: Chọn tùy chọn này nếu ngôn ngữ bạn cần không hiển thị trong danh sách. Trong hộp thoại Trình biên tập ngôn ngữ, chọn tùy chọn Chỉ định ngôn ngữ thủ công rồi chọn ngôn ngữ hoặc các ngôn ngữ mong muốn bằng cách chọn các ô thích hợp. Nếu bạn thường sử dụng kết hợp ngôn ngữ cụ thể, bạn có thể tạo một nhóm mới cho những ngôn ngữ này.

        Nếu một ngôn ngữ không có trong danh sách, hoặc là:

           * Ngôn ngữ này không được hỗ trợ bởi ABBYY FineReader. Để biết danh sách đầy đủ các ngôn ngữ được hỗ trợ, xem "Ngôn ngữ được hỗ trợ".

           * Ngôn ngữ này không được hỗ trợ bởi bản sao phần mềm của bạn. Danh sách đầy đủ các ngôn ngữ hiện có trong bản sao của bạn có thể tìm thấy trong hộp thoại Giấy phép (Trợ giúp > Giới thiệu… > Thông tin giấy phép).

        Ngoài việc sử dụng các ngôn ngữ và nhóm ngôn ngữ tích hợp, bạn có thể tạo ngôn ngữ của riêng mình. Để biết chi tiết, xem "Nếu chương trình không nhận dạng được một số ký tự".

        b. Kiểu in

        Tài liệu có thể được in trên nhiều thiết bị khác nhau như máy đánh chữ và máy fax. Chất lượng OCR có thể được cải thiện bằng cách chọn đúng Loại tài liệu trong hộp thoại Tùy chọn.

        Đối với hầu hết các tài liệu, chương trình sẽ phát hiện kiểu in tự động. Để phát hiện kiểu in tự động, tùy chọn Tự động phải được chọn trong Loại tài liệu trong hộp thoại Tùy chọn (Công cụ > Tùy chọn…). Bạn có thể xử lý tài liệu ở chế độ màu đầy đủ hoặc đen trắng.

        Bạn cũng có thể chọn để lựa chọn kiểu in theo cách thủ công nếu cần.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY10_zps69s8bhgg.jpg)

        a: Ví dụ về văn bản được đánh máy. Tất cả nét chữ có chiều rộng bằng nhau (so sánh, ví dụ: "w" và "t"). Đối với văn bản thuộc loại này, chọn Máy đánh chữ.

        b: Ví dụ về văn bản được tạo ra bởi máy fax. Như bạn có thể thấy từ ví dụ, các nét chữ không rõ ràng trong một số vị trí, ngoài hiện tượng nhiễu và biến dạng. Đối với văn bản thuộc loại này, chọn Fax.

        Gợi ý: Sau khi nhận dạng văn bản được đánh máy hoặc fax, đảm bảo chọn Tự động trước khi xử lý các tài liệu in thông thường.



Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 03 Tháng Tư, 2017, 07:38:05 AM

        c. Chất lượng in

        Tài liệu có chất lượng kém bị "nhiễu" (nghĩa là có chấm hoặc vệt màu đen ngẫu nhiên), nét chữ không đều và bị mờ hoặc các dòng bị nghiêng và đường viền bảng bị dịch chuyển có thể yêu cầu cài đặt quét cụ thể.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY11_zpsizkiywd2.jpg)

        Tài liệu có chất lượng kém được quét tốt nhất ở thang độ xám. Khi quét ở thang độ xám, chương trình sẽ tự động chọn giá trị độ sáng tối ưu.

        Chế độ quét thang độ xám giữ lại nhiều thông tin hơn về nét chữ trong văn bản được quét để có được kết quả OCR tốt hơn khi nhận dạng tài liệu có chất lượng từ trung bình đến kém. Bạn cũng có thể sửa một số lỗi bằng cách thủ công sử dụng công cụ chỉnh sửa hình ảnh có trong Biên tập ảnh. Để biết chi tiết, xem "Xử lý sơ bộ ảnh".

        d. Chế độ màu

        Nếu bạn không cần giữ màu gốc của tài liệu màu đầy đủ, bạn có thể xử lý tài liệu ở chế độ đen trắng. Điều này sẽ giảm đáng kể kích cỡ tài liệu ABBYY FineReader thu được và tăng tốc quy trình OCR. Tuy nhiên, xử lý hình ảnh có độ tương phản thấp ở chế độ đen trắng có thể dẫn đến chất lượng OCR kém. Chúng tôi cũng không đề xuất xử lý ở chế độ đen trắng cho ảnh, trang tạp chí và văn bản bằng Tiếng Trung, Tiếng Nhật và Tiếng Hàn.

        Lưu ý: Bạn cũng có thể tăng tốc độ nhận dạng tài liệu màu và đen trắng bằng cách chọn tùy chọn Đọc nhanh trên tab Đọc của hộp thoại Tùy chọn. Để biết thêm thông tin về các chế độ nhận dạng, xem Tùy chọn OCR.

        Để chọn chế độ màu:

        - Sử dụng danh sách thả xuống Chế độ màu trong hộp thoại Tác vụ hoặc

        - Chọn một trong các tùy chọn trong Chế độ màu trên tab Tài liệu của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

        Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu. Để có tài liệu màu, mở tệp với hình ảnh màu hoặc quét tài liệu giấy ở chế độ màu.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 04 Tháng Tư, 2017, 09:15:52 AM

        3/ Tùy chọn OCR

        a. Chế độ đọc

        Có hai chế độ đọc trong ABBYY FineReader 12:

        - Đọc kỹ: Trong chế độ này, ABBYY FineReader phân tích và nhận dạng cả tài liệu đơn giản và tài liệu có bố cục phức tạp, thậm chí cả tài liệu có văn bản in trên nền màu hoặc đường quét và tài liệu có bảng phức hợp (bao gồm bảng có đường lưới màu trắng và bảng có ô màu).


        Lưu ý: So với chế độ Nhanh, chế độ Kỹ tốn nhiều thời gian hơn nhưng đảm bảo chất lượng nhận dạng tốt hơn.

        - Đọc nhanh: Chế độ này được đề xuất để xử lý tài liệu lớn có bố cục đơn giản và hình ảnh chất lượng tốt.

        b. Phát hiện thành phần cấu trúc

        Chọn các thành phần cấu trúc mà bạn muốn chương trình phát hiện: đầu trang và chân trang, chú thích cuối trang, mục lục và danh sách. Những thành phần đã chọn sẽ tương tác khi tài liệu được lưu.

        c. Lập mẫu

        Nhận dạng và lập mẫu được sử dụng để nhận dạng các loại văn bản sau:

        - Văn bản có các thành phần trang trí

        - Văn bản có các ký hiệu đặc biệt (ví dụ: ký hiệu toán học ít gặp)

        - Khối lượng lớn văn bản từ hình ảnh chất lượng kém (trên 100 trang)

        Tùy chọn Đọc và huấn luyện bị tắt theo mặc định. Bật tùy chọn này để lập mẫu cho ABBYY FineReader khi nhận dạng văn bản.

        Bạn có thể sử dụng các mẫu tích hợp hoặc tùy chỉnh để nhận dạng. Chọn một trong các tùy chọn trong Huấn luyện để chọn mẫu nào bạn muốn sử dụng.

        d. Ngôn ngữ và mẫu người dùng

        Bạn có thể lưu và tải cài đặt mẫu người dùng và ngôn ngữ. Để biết chi tiết, xem "Tài liệu FineReader là gì?"

        e. Phông chữ

        Tại đây bạn có thể chọn phông chữ sẽ được sử dụng khi lưu văn bản được nhận dạng.
        Để chọn phông chữ:

        - Nhấp vào nút Phông chữ….

        - Chọn phông chữ mong muốn và nhấp vào OK.

        f. Mã vạch

        Nếu tài liệu của bạn chứa mã vạch và bạn muốn chuyển đổi chúng sang chuỗi chữ cái và chữ số thay vì lưu dưới dạng ảnh, chọn Tìm kiếm mã vạch. Tính năng này bị tắt theo mặc định.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 04 Tháng Tư, 2017, 09:36:57 PM
           
       4/ Làm việc với ngôn ngữ chữ viết phức tạp

       a. Cài đặt hỗ trợ ngôn ngữ

        Để có thể nhận dạng văn bản viết bằng Tiếng Ả Rập, Tiếng Do Thái, Tiếng Yiddish, Tiếng Thái, Tiếng Trung, Tiếng Nhật và Tiếng Hàn, bạn có thể cần cài đặt những ngôn ngữ này.

        Microsoft Windows 8, Windows 7 và Windows Vista hỗ trợ những ngôn ngữ này theo mặc định.

        Để cài đặt ngôn ngữ mới trong Microsoft Windows XP:

­        - Nhấp vào Bắt đầu trên thanh tác vụ.

­        - Nhấp vào Bảng điều khiển > Tùy chọn khu vực và ngôn ngữ.

­        - Nhấp vào tab Ngôn ngữ và chọn các tùy chọn sau:

           + Cài đặt các đặt tệp cho ngôn ngữ chữ viết phức tạp và ngôn ngữ từ phải sang trái (bao gồm Tiếng Thái): để bật hỗ trợ cho Tiếng Ả Rập, Tiếng Do Thái, Tiếng Yiddish và Tiếng Thái

           + Cài đặt tệp cho ngôn ngữ Đông Á: để bật hỗ trợ cho Tiếng Nhật, Tiếng Trung và Tiếng Hàn

­           + Nhấp vào OK.

        b. Phông chữ khuyến nghị

        Nhận dạng văn bản bằng tiếng Tiếng Ả Rập, Tiếng Do Thái, Tiếng Yiddish, Tiếng Thái, Tiếng Trung, Tiếng Nhật và Tiếng Hàn có thể cần cài đặt các phông chữ bổ sung trong Windows. Bảng dưới đây liệt kê các phông chữ khuyến nghị cho văn bản bằng những ngôn ngữ này.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBY12_zpsddnmgnjs.jpg)

        * Phông chữ này được cài đặt cùng với Microsoft Windows XP và Microsoft Office 2000 hoặc mới hơn.

        Các phần dưới đây có lời khuyên về cách cải thiện độ chính xác nhận dạng.

        c. Tắt xử lý tự động

        Theo mặc định, bất kỳ trang nào bạn thêm vào Tài liệu ABBYY FineReader đều được nhận dạng tự động. Tuy nhiên, nếu tài liệu của bạn chứa văn bản ở ngôn ngữ CJK kết hợp với một ngôn ngữ châu Âu, chúng tôi đề xuất bạn tắt phát hiện hướng trang tự động và chỉ sử dụng tùy chọn tách trang kép nếu tất cả các hình ảnh trang đều đúng hướng (ví dụ: chúng không được quét từ dưới lên).

        Có thể bật và tắt tùy chọn Phát hiện hướng trang và Tách các trang đối diện trên tab Quét/Mở của hộp thoại Tùy chọn.

        Lưu ý: Để tách các trang đối diện bằng Tiếng Ả Rập, Tiếng Do Thái hoặc Tiếng Yiddish, đảm bảo trước hết chọn ngôn ngữ nhận dạng tương ứng và sau đó mới chọn tùy chọn Tách các trang đối diện. Việc này sẽ đảm bảo rằng các trang được sắp xếp đúng thứ tự. Bạn cũng có thể khôi phục cách đánh số trang gốc bằng cách chọn tùy chọn Đổi trang sách. Để biết chi tiết, xem "Tài liệu FineReader là gì?"

        Nếu tài liệu của bạn có cấu trúc phức tạp, chúng tôi khuyến nghị tắt phân tích và OCR tự động đối với hình ảnh và thực hiện thủ công các thao tác này.

        Để tắt phân tích và OCR tự động:

­        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

­­        - Bỏ chọn tùy chọn Tự động xử lý các trang khi chúng được thêm vào trên tab Quét/Mở.

­­        - Nhấp vào OK.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 06 Tháng Tư, 2017, 03:32:42 AM
   
        d. Nhận dạng tài liệu được viết bằng nhiều ngôn ngữ

        Trong hướng dẫn bên dưới, một tài liệu chứa cả văn bản Tiếng Anh và Tiếng Trung được lấy làm ví dụ.

­        - Trên thanh công cụ chính, chọn Ngôn ngữ khác… từ danh sách thả xuống Ngôn ngữ của tài liệu. Chọn Chỉ định ngôn ngữ thủ công từ hộp thoại Trình biên tập ngôn ngữ và chọn Tiếng Trung và Tiếng Anh từ danh sách ngôn ngữ.

­­        - Quét hoặc mở hình ảnh.

­        - Nếu chương trình không phát hiện được tất cả các vùng trên hình ảnh:

           + Chỉ định vùng thủ công bằng công cụ chỉnh sửa vùng.

           + Chỉ định vùng chỉ chứa một ngôn ngữ. Để làm như vậy, chọn vùng và chỉ định ngôn ngữ trong ngăn Thuộc tính vùng.

­        Quan trọng! Chỉ có thể chỉ định ngôn ngữ cho các vùng cùng loại. Nếu bạn đã chọn các vùng thuộc nhiều loại khác nhau, như Văn bản và Bảng, bạn sẽ không thể chỉ định ngôn ngữ.

           + Nếu cần, chọn hướng văn bản từ danh sách thả xuống Định hướng (để biết chi tiết, xem Nếu văn bản dọc hoặc đảo ngược không được nhận dạng).

           + Đối với văn bản bằng các ngôn ngữ CJK, chương trình cung cấp lựa chọn hướng văn bản trong danh sách thả xuống Hướng của văn bản CJK (để biết chi tiết, xem Nếu văn bản dọc hoặc đảo ngược không được nhận dạng đúng).

­        - Nhấp vào nút Đọc trên thanh công cụ chính.

        e. Ký tự phi châu Âu không hiển thị trong cửa sổ Văn bản

        Nếu văn bản trong ngôn ngữ CJK được hiển thị không đúng trong cửa sổ Văn bản, bạn có thể đã chọn chế độ Văn bản thuần túy.

        Để thay đổi phông chữ được sử dụng trong chế độ Văn bản thuần túy:

­        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…).
­        - Nhấp vào tab Xem.

­        - Chọn Arial Unicode MS từ danh sách thả xuống Phông chữ được sử dụng để hiển thị văn bản thuần túy.

­        - Nhấp vào OK.

        Nếu việc này không hiệu quả và văn bản trong cửa sổ Văn bản vẫn được hiển thị không đúng, xem "Nếu một số ký tự được thay thế bằng"?" hoặc "□" trong cửa sổ Văn bản".

        f. Thay đổi hướng của văn bản được nhận dạng

        ABBYY FineReader tự động phát hiện hướng văn bản, nhưng bạn cũng có thể chỉ định hướng văn bản thủ công.

­        - Chọn một hoặc nhiều đoạn trong cửa sổ Văn bản.

­        - Nhấp vào nút  trên thanh công cụ của cửa sổ Văn bản.

        Lưu ý: Bạn có thể sử dụng danh sách thả xuống Hướng của văn bản CJK trong cửa sổ Hình ảnh để chỉ định hướng của văn bản trước khi nhận dạng. Xem Nếu văn bản dọc hoặc đảo ngược không được nhận dạng đúng để biết chi tiết.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 07 Tháng Tư, 2017, 11:14:35 PM
           
        VII - GỢI Ý ĐỂ CẢI THIỆN CHẤT LƯỢNG OCR

        1/ Nếu cấu trúc phức tạp của tài liệu giấy không được tái tạo

        Trước khi chạy quy trình nhận dạng tài liệu, ABBYY FineReader thực hiện phân tích cấu trúc lôgic của tài liệu và phát hiện các vùng chứa văn bản, ảnh, bảng và mã vạch. Chương trình sau đó dựa vào phân tích này để xác định các vùng và thứ tự mà vùng được nhận dạng. Thông tin này giúp tái tạo định dạng của tài liệu gốc.

        Theo mặc định, ABBYY FineReader sẽ phân tích tài liệu tự động. Tuy nhiên, trong trường hợp định dạng rất phức tạp, một số vùng có thể được phát hiện không chính xác và bạn có thể muốn sửa chúng thủ công.

        Sử dụng các công cụ và lệnh sau để sửa vùng:

        - Công cụ điều chỉnh vùng thủ công trên thanh công cụ của cửa sổ Hình ảnh.

        - Các lệnh menu chuột phải sẵn có bằng cách nhấp chuột phải vào vùng đã chọn trong cửa sổ Hình ảnh hoặc cửa sổ Thu phóng.

        - Các lệnh trong menu Vùng.

        Bắt đầu lại quy trình OCR sau khi thực hiện điều chỉnh mong muốn.

        Cũng xem: Nếu vùng được phát hiện không chính xác.

        Cài đặt nhận dạng, cài đặt thuộc tính vùng và lưu cũng có ảnh hưởng đến việc bố cục của tài liệu gốc được lập mẫu lại tốt như thế nào. Để biết chi tiết, xem các phần sau: "Tùy chọn OCR", "Điều chỉnh thuộc tính vùng" và "Lưu kết quả OCR".

        2/ Nếu vùng được phát hiện không chính xác

        ABBYY FineReader phân tích hình ảnh trang trước khi nhận dạng và phát hiện những loại vùng khác nhau trên những hình ảnh này như Văn bản, Ảnh, Ảnh nền, Bảng và Mã vạch. Phân tích này xác định vùng nào sẽ được nhận dạng và theo thứ tự nào. Trong giao diện người dùng, các loại vùng khác nhau được phân biệt theo màu sắc đường viền của chúng.

        Nếu bạn nhấp vào một vùng, vùng đó sẽ được tô sáng và sẽ trở nên hiện hoạt. Bạn cũng có thể điều chỉnh vùng bằng cách nhấn phím Tab. Các số của vùng xác định thứ tự mà chúng đã được chọn khi nhấn phím Tab. Theo mặc định, các số vùng này không hiển thị trong cửa sổ Hình ảnh và chỉ xuất hiện nếu công cụ Sắp xếp thứ tự vùng được chọn.

        Có thể tìm thấy công cụ khoanh vùng và chỉnh sửa vùng thủ công trong cửa sổ Hình ảnh và trên thanh công cụ bật lên cho vùng Văn bản, Ảnh, Ảnh nền và Bảng (thanh công cụ bật lên xuất hiện bên cạnh vùng hoạt động).

        Quan trọng! Sau khi bạn hoàn tất chỉnh sửa vùng, chạy lại quy trình OCR.

        Bạn có thể sử dụng các công cụ chỉnh sửa vùng để:

        - Tạo vùng mới

        - Điều chỉnh đường viền vùng

        - Thêm hoặc xóa bỏ các phần của vùng

        - Chọn một hoặc nhiều vùng

        - Di chuyển vùng

        - Xếp lại thứ tự vùng

        - Xóa vùng

        - Thay đổi hướng văn bản trong vùng

        - Thay đổi màu của đường viền vùng

        - Tạo vùng mới

                + Nhấp vào một công cụ trong cửa sổ Hình ảnh:

                + khoanh vùng nhận dạng

                + khoanh vùng Văn bản;

                + khoanh vùng Ảnh;

                + khoanh vùng Ảnh nền;

                + khoanh vùng Bảng.

        - Bấm và giữ nút chuột trái và di chuyển con trỏ chuột để khoanh vùng.

        Có thể khoanh vùng mới mà không cần chọn công cụ từ thanh công cụ của cửa sổ Hình ảnh. Bạn có thể chỉ cần khoanh vùng trên hình ảnh sử dụng một trong những tổ hợp phím sau đây:

        - Ctrl+Shift khoanh vùng Văn bản

        - Alt+Shift khoanh vùng Ảnh

        - Ctrl+Alt khoanh vùng Bảng

        - Ctrl+Shift+Alt khoanh vùng Mã vạch

        Bạn có thể thay đổi loại vùng. Nhấp chuột phải vào vùng đã chọn, nhấp vào Đổi loại vùng từ menu chuột phải rồi nhấp vào loại vùng mong muốn.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 08 Tháng Tư, 2017, 06:40:16 AM

        - Điều chỉnh đường viền vùng

           + Đặt con trỏ chuột trên đường viền vùng.

           + Nhấp chuột trái và kéo theo hướng mong muốn.

        Lưu ý: Bạn có thể điều chỉnh đồng thời đường viền ngang và dọc của vùng bằng cách đặt con trỏ chuột ở góc của vùng.

        - Mở rộng/xóa bỏ vùng

           + Chọn công cụ  trên thanh công cụ bật lên của vùng Văn bản, Ảnh hoặc Ảnh nền.

           + Đặt con trỏ chuột bên trong vùng và chọn một phần hình ảnh. Phân đoạn này sẽ được thêm vào hoặc bị xóa khỏi vùng.

           + Điều chỉnh đường viền vùng, nếu cần.

        Lưu ý:

           + Những công cụ này chỉ có thể áp dụng cho vùng Văn bản, Ảnh hoặc Ảnh nền. Bạn không thể thêm hoặc xóa phân đoạn trong vùng Bảng hoặc Mã vạch.

           + Đường viền vùng cũng có thể được điều chỉnh bằng cách thêm các điểm chỉnh cỡ. Phân đoạn thu được có thể được kéo theo bất kỳ hướng nào sử dụng chuột. Để thêm điểm chỉnh cỡ mới, đặt con trỏ tại điểm mong muốn trên đường viền trong khi bấm và giữ Ctrl+Shift (thao tác này chuyển con trỏ thành con trỏ dạng chữ thập) và nhấp. Một điểm chỉnh cỡ mới sẽ xuất hiện trên đường viền vùng.

        - Chọn một hoặc nhiều vùng: Chọn công cụ   hoặc  trên thanh công cụ của cửa sổ Hình ảnh và nhấp vào vùng mong muốn trong khi bấm và giữ phím Ctrl. Để hủy lựa chọn, nhấp vào vùng đã chọn một lần nữa.

        - Di chuyển vùng: Chọn một vùng và di chuyển vùng trong khi bấm và giữ phím Ctrl.

        - Xếp lại thứ tự vùng

           + Nhấp vào  trên thanh công cụ hoặc nhấp vào Sắp thứ tự vùng trên menu Vùng.

           + Chọn vùng theo thứ tự mong muốn cho tài liệu đầu ra.

        Lưu ý: Vùng được tự động đánh số từ trái sang phải trong quá trình phân tích trang tự động, bất kể hướng của văn bản trên hình ảnh.

        - Xóa vùng

           + Chọn vùng bạn muốn xóa rồi bấm phím Delete.

           + Chọn vùng bạn muốn xóa, nhấp chuột phải vào một trong các vùng rồi nhấp vào Xóa trên menu chuột phải.

           + Chọn công cụ  và nhấp vào vùng bạn muốn xóa.

        Để xóa tất cả các vùng:

           + Nhấp vào Xóa tất cả vùng và văn bản trên menu chuột phải của Hình ảnh.

        Quan trọng! Xóa một vùng khỏi hình ảnh đã được nhận dạng cũng sẽ xóa đoạn tương ứng trong cửa sổ Văn bản.

        - Thay đổi hướng văn bản: Nhấp chuột phải vào vùng, nhấp vào Thuộc tính trên menu chuột phải để mở ngăn Thuộc tính vùng rồi chọn hướng văn bản mong muốn từ danh sách thả xuống Định hướng.

        Để biết thêm thông tin về chỉnh sửa thuộc tính văn bản của vùng văn bản, xem "Điều chỉnh thuộc tính vùng văn bản".

        - Thay đổi màu đường viền vùng

           + Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Xem.

           + Chọn loại vùng trong Hình thức và chọn màu trong bảng Màu.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 09 Tháng Tư, 2017, 06:12:54 AM

        3/ xử lý một số lượng lớn tài liệu có bố cục tương tự nhau

        Nếu bạn đang xử lý một số lượng lớn tài liệu có bố cục giống nhau (ví dụ: biểu mẫu hoặc bảng câu hỏi), phân tích bố cục của mỗi trang sẽ tốn rất nhiều thời gian. Để tiết kiệm thời gian, bạn có thể phân tích chỉ một tài liệu trong một nhóm tài liệu tương tự nhau và lưu các vùng được phát hiện dưới dạng mẫu. Sau đó bạn có thể sử dụng mẫu này cho các tài liệu khác trong nhóm.

        Để tạo mẫu vùng:

        - Mở hình ảnh và để chương trình phân tích bố cục tự động hoặc khoanh vùng thủ công.

        - Trên menu Vùng, nhấp vào Lưu mẫu vùng… Trong hộp thoại lưu, cung cấp tên cho mẫu của bạn và nhấp vào Lưu.

        Quan trọng! Để có thể sử dụng mẫu vùng, bạn phải quét tất cả các tài liệu trong nhóm sử dụng cùng giá trị độ phân giải.

        Áp dụng mẫu vùng:

        - Trong cửa sổ Trang, chọn các trang mà bạn muốn áp dụng mẫu vùng.

        - Trên menu Vùng, nhấp vào Tải mẫu vùng…

        - Trong hộp thoại Mở mẫu vùng, chọn mẫu vùng mong muốn (tệp mẫu vùng có phần mở rộng *.blk).

        - Trong cùng hộp thoại, bên cạnh Áp dụng cho, chọn Trang được chọn để áp dụng mẫu cho các trang được chọn.

         Lưu ý: Chọn Tất cả các trang để áp dụng mẫu cho tất cả các trang trong tài liệu ABBYY FineReader hiện tại.

        - Nhấp vào nút Mở.

        4/ Nếu bảng không được phát hiện
        Vùng bảng đánh dấu bảng hoặc đoạn văn bản được sắp xếp trong dạng bảng. Nếu chương trình không thể phát hiện bảng tự động, sử dụng công cụ Bảng để khoanh vùng bảng quanh bảng.

        - Chọn công cụ  trên thanh công cụ ở đầu cửa sổ Hình ảnh và sử dụng chuột để khoanh hình chữ nhật quanh bảng trên hình ảnh của bạn.

        - Nhấp chuột phải vào bảng rồi nhấp Phân tích cấu trúc bảng trên menu chuột phải hoặc nhấp vào nút  trên thanh công cụ bật lên của vùng Bảng.

        - Sử dụng thanh công cụ bật lên, menu chuột phải của vùng bảng hoặc các lệnh trên menu Vùng để chỉnh sửa kết quả.

        - Chạy lại quy trình OCR.

        Bạn có thể thay đổi loại vùng đã được nhận dạng. Để thay đổi loại vùng thành Bảng, nhấp chuột phải vào vùng rồi nhấp Đổi loại vùng > Bảng trên menu chuột phải.

        Nếu ABBYY FineReader không thể phát hiện chính xác hàng và cột trong bảng tự động, bạn có thể điều chỉnh bố cục thủ công và chạy lại quy trình OCR.

        - Sử dụng các lệnh trên menu Vùng hoặc các lệnh trên menu chuột phải cùng vùng Bảng để:

              + Phân tích cấu trúc bảng (tự động phân tích cấu trúc bảng và tránh
cho bạn khỏi rắc rối của việc vẽ dấu phân cách ngang và dọc thủ công);

              + Tách ô, Hợp nhất ô và Hợp nhất dòng (cho phép bạn sửa mọi hàng hoặc cột bị xác định sai)

              + Sử dụng thanh công cụ bật lên của bảng đã chọn để: Thêm dấu phân cách ngang hoặc dọc, xóa dấu phân cách bảng, phân tích cấu trúc bảng, tách ô bảng hoặc trộn ô hoặc hàng bảng (nhấp vào vùng Bảng rồi nhấp vào công cụ thích hợp trên thanh công cụ bật lên:   ).

        Gợi ý: Nhấp vào công cụ  trên thanh công cụ bật lên để chọn đối tượng.

        Lưu ý:

              + Lệnh tách ô chỉ có thể được áp dụng cho ô bảng đã được trộn trước đó.

              + Để trộn hoặc tách ô hoặc hàng bảng, chọn chúng trên hình ảnh rồi chọn công cụ hoặc lệnh menu thích hợp.

              + Nếu bảng chứa ô văn bản dọc, bạn có thể cần thay đổi thuộc tính văn bản trước.

              + Nếu ô bảng chỉ chứa hình ảnh, chọn tùy chọn Xử lý các ô đã chọn như hình ảnh trong ngăn Thuộc tính vùng (nhấp chuột phải vào vùng rồi nhấp vào Thuộc tính trên menu chuột phải).

        Nếu ô chứa tổ hợp hình ảnh và văn bản, chọn hình ảnh để chuyển thành vùng riêng biệt bên trong ô.

         Cũng xem:

              + Nếu văn bản dọc hoặc đảo ngược không được nhận dạng

              + Nếu vùng được phát hiện không chính xác

              + Điều chỉnh thuộc tính vùng


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 11 Tháng Tư, 2017, 09:52:16 AM
     
        5/ Nếu ảnh không được phát hiện

        Vùng ảnh đánh dấu ảnh được chứa trong tài liệu của bạn. Bạn cũng có thể sử dụng Vùng ảnh nếu bạn không muốn đoạn văn bản được nhận dạng. Nếu chương trình không thể phát hiện ảnh tự động, sử dụng công cụ Ảnh để khoanh vùng ảnh quanh ảnh theo cách thủ công.

        - Trên thanh công cụ ở đầu cửa sổ Hình ảnh, chọn công cụ  rồi sử dụng chuột để khoanh hình chữ nhật quanh ảnh trên hình ảnh của bạn.

        - Chạy lại quy trình OCR.

        Nếu có văn bản in trên ảnh trong tài liệu của bạn, khoanh vùng Ảnh nền quanh ảnh.

        - Trong cửa sổ Hình ảnh, chọn  trên thanh công cụ và vẽ khung quanh ảnh.
Lưu ý: Nếu bạn không thấy công cụ này trên thanh công cụ, thêm công cụ này. Xem Thanh công cụ để biết hướng dẫn chi tiết.

        - Khởi động quy trình OCR.

        Bạn có thể thay đổi vùng hiện tại thành Ảnh hoặc Ảnh nền. Nhấp chuột phải vào vùng rồi nhấp vào Đổi loại vùng thành > Hình ảnh hoặc Đổi loại vùng thành > Hình ảnh nền.

         Để biết thêm về loại vùng và chỉnh sửa vùng, xem Nếu vùng được phát hiện không chính xác.

        6/ Nếu mã vạch không được phát hiện

        Vùng mã vạch đánh dấu các mã vạch chứa trong tài liệu. Nếu tài liệu của bạn chứa mã vạch mà bạn muốn đưa ra dưới dạng chuỗi chữ cái và chữ số chứ không phải hình ảnh, chọn mã vạch và thay đổi loại vùng thành Mã vạch.

        Lưu ý: Nhận dạng mã vạch bị tắt theo mặc định. Để bật nhận dạng mã vạch, nhấp vào Công cụ > Tùy chọn…, nhấp vào tab Đọc và chọn tùy chọn Tìm kiếm mã vạch.

        Để khoanh vùng mã vạch và nhận dạng vùng:

        - Giữ Ctrl+Shift+Alt và sử dụng chuột để chọn mã vạch trong cửa sổ Hình ảnh hoặc trong cửa sổ Thu phóng.

        - Chạy quy trình OCR.

        Các loại mã vạch được hỗ trợ:

              + Mã 3 trên 9
              + Mã kiểm tra 3 trên 9
              + Mã 3 trên 9 không có dấu hoa thị
              + Codabar
              + Mã 93
              + Mã 128
              + EAN 8
              + EAN 13
              + IATA 2 trên 5
              + Xen kẽ 2 trên 5
              + Xen kẽ kiểm tra 2 trên 5
              + Ma trận 2 trên 5
              + Postnet
              + Chuẩn công nghiệp 2 trên 5
              + UCC-128
              + UPC-A
              + UPC-E
              + PDF417
              + Mã Aztec
              + Ma trận dữ liệu
              + Mã QR
              + Mã vá

        Lưu ý: Loại mã vạch mặc định là Dò tự động, điều đó có nghĩa là loại mã vạch sẽ được phát hiện tự động. Tuy nhiên, không phải tất cả các loại mã vạch đều được tự động phát hiện và đôi khi bạn có thể cần chọn loại thích hợp một cách thủ công trên ngăn Thuộc tính vùng.

        ABBYY FineReader có thể tự động phát hiện các loại mã vạch sau: Mã 3 trên 9, Mã 93, Mã 128, EAN 8, EAN 13, Postnet, UCC-128, UPC-E, PDF417, UPC-A và mã QR.

        7/ Điều chỉnh thuộc tính vùng

        Khi thực hiện phân tích tài liệu tự động, ABBYY FineReader phát hiện các loại vùng khác nhau trên các trang tài liệu (như bảng, ảnh, văn bản và mã vạch). Chương trình cũng phân tích cấu trúc tài liệu và xác định tiêu đề và các thành phần bố cục khác như đầu trang và chân trang, hình ảnh và chú thích biểu đồ, v.v..

        Bạn có thể thay đổi thủ công các thuộc tính được xác định sai trong một số vùng Văn bản và Bảng.

        Chọn vùng trong cửa sổ Hình ảnh hoặc cửa sổ Thu phóng và điều chỉnh các thuộc tính trong ngăn Thuộc tính vùng của cửa sổ Hình ảnh.

        Ngăn Thuộc tính vùng cho phép bạn đặt các thuộc tính sau:

        - Ngôn ngữ. Để biết chi tiết, xem "Các tính năng của tài liệu cần xem xét trước khi OCR".

        - Chức năng hiển thị chức năng của văn bản, ví dụ đầu trang hoặc chân trang, ghi chú cuối trang, v.v... (chỉ áp dụng đối với các vùng Văn bản).

        - Định hướng. "Để biết chi tiết, xem Nếu văn bản dọc hoặc đảo ngược không được nhận dạng".

        - Kiểu in. Để biết chi tiết, xem "Các tính năng của tài liệu cần xem xét trước khi OCR".

        - Đảo ngược. "Để biết chi tiết, xem "Nếu văn bản dọc hoặc đảo ngược không được nhận dạng".

        - Hướng của văn bản CJK. Để biết chi tiết, xem "Làm việc với ngôn ngữ chữ viết phức tạp".

        Lưu ý:

        Sử dụng các nút  /  để điều hướng sang trái và sang phải dọc theo ngăn thuộc tính nếu cửa sổ Hình ảnh không đủ rộng để hiển thị toàn bộ ngăn thuộc tính.

        Có thể sửa đổi một số thuộc tính văn bản sử dụng menu chuột phải khả dụng khi bạn nhấp chuột phải vào vùng Văn bản.

       Chạy lại quy trình OCR sau khi thực hiện các thay đổi cần thiết.

       Cũng xem "Nếu vùng được phát hiện không chính xác".


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 12 Tháng Tư, 2017, 01:23:16 AM
       
        8/ Phông chữ không chính xác được sử dụng hoặc một số ký tự được thay thế bằng "?" hoặc "□"

        Nếu bạn thấy "?" hoặc "□" thay thế các chữ cái trong cửa sổ Văn bản, kiểm tra để xem liệu phông chữ đã chọn để hiển thị văn bản được nhận dạng có chứa tất cả các ký tự được sử dụng trong văn bản của bạn không.

         Để biết chi tiết, xem "Phông chữ bắt buộc".

        Bạn có thể thay đổi phông chữ trong văn bản được nhận dạng mà không cần khởi chạy lại quy trình OCR.

        Để thay đổi phông chữ trong một tài liệu ngắn:

        - Chọn đoạn văn bản có một số ký tự được hiển thị không chính xác.

        - Nhấp chuột phải vào lựa chọn rồi nhấp vào Thuộc tính trên menu chuột phải.

        - Trong ngăn Thuộc tính văn bản, chọn phông chữ mong muốn. Phông chữ trong đoạn văn bản đã chọn sẽ thay đổi tương ứng.

        Để thay đổi phông chữ trong tài liệu dài có kiểu được sử dụng:

        - Trên menu Công cụ, nhấp vào Trình biên tập phong cách….

        - Trong hộp thoại Trình biên tập kiểu, chọn kiểu mong muốn và thay đổi phông chữ.

        - Nhấp vào OK. Phông chữ trong tất cả các đoạn văn bản sử dụng kiểu này sẽ thay đổi tương ứng.

        Quan trọng! Nếu tài liệu ABBYY FineReader được nhận dạng hoặc chỉnh sửa trên máy tính khác, văn bản trong tài liệu có thể được hiển thị không chính xác trên máy tính của bạn. Nếu bạn gặp trường hợp này, đảm bảo tất cả phông chữ được sử dụng trong tài liệu này được cài đặt trên máy của bạn.

        9/ Tài liệu in chứa phông chữ phi tiêu chuẩn

        Chế độ lập mẫu cải thiện chất lượng OCR trên tài liệu có phông chữ trang trí hoặc tài liệu chứa các ký tự đặc biệt (ví dụ: ký hiệu toán học).

        Lưu ý: Bạn không nên sử dụng chế độ lập mẫu trong các trường hợp khác, vì kết quả thu được về chất lượng nhận dạng sẽ không đáng kể so với thời gian và công sức bạn bỏ ra để lập mẫu.

        Trong chế độ lập mẫu, mẫu người dùng được tạo có thể được sử dụng khi
thực hiện OCR trên toàn bộ văn bản.

        - Sử dụng mẫu người dùng

        - Tạo và lập mẫu người dùng

        - Chọn mẫu người dùng

        - Chỉnh sửa mẫu người dùng

        a/ Sử dụng mẫu người dùng

        Để sử dụng mẫu để nhận dạng tài liệu:

        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.

        - Trong Huấn luyện, chọn tùy chọn Chỉ sử dụng mẫu người dùng.

        Lưu ý: Nếu bạn chọn Sử dụng mẫu có sẵn và người dùng, ABBYY FineReader 12 sẽ sử dụng cả mẫu người dùng và mẫu được đặt trước khi xuất xưởng để OCR.

        - Nhấp vào nút Trình biên tập mẫu….

        - Trong hộp thoại Trình biên tập mẫu, chọn mẫu mong muốn rồi nhấp OK.

        - Trong cửa sổ chính ABBYY FineReader, nhấp vào nút Đọc.

        b/ Tạo và lập mẫu người dùng

        Để lập mẫu nhận dạng riêng để nhận dạng các ký tự và chữ dính mới:

        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.

        - Trong Huấn luyện, chọn Sử dụng mẫu có sẵn và người dùng hoặc Chỉ sử dụng mẫu người dùng.

        - Chọn tùy chọn Đọc và huấn luyện.

        - Nhấp vào nút Trình biên tập mẫu….

        Lưu ý: Không hỗ trợ lập mẫu cho ngôn ngữ châu Á.

        - Trong hộp thoại Trình biên tập mẫu, nhấp vào Mới…

        - Hộp thoại Tạo mẫu sẽ mở ra. Nhập tên của mẫu người dùng và nhấp OK.

        - Đóng hộp thoại Trình biên tập mẫu và Tùy chọn bằng cách nhấp vào nút OK trong mỗi hộp thoại.

        - Trên thanh công cụ ở đầu cửa sổ Hình ảnh, nhấp vào Đọc.

        Giờ đây, nếu ABBYY FineReader gặp một ký tự chưa xác định, ký tự này sẽ được hiển thị trong hộp thoại Đào tạo về mẫu chữ.

        - Hướng dẫn chương trình đọc các ký tự và chữ dính mới.

        Chữ dính là tổ hợp của hai hay ba ký tự bị "dính vào nhau" (ví dụ: fi, fl, ffi, v.v..) và làm cho chương trình khó tách riêng. Thực tế, có thể đạt được các kết quả tốt hơn bằng cách coi chúng là các ký tự ghép.

        Lưu ý: Các từ được in kiểu in đậm hoặc in nghiêng trong văn bản của bạn hoặc các từ trong ký tự trên đầu/ký tự dưới chân có thể được giữ lại trong văn bản nhận dạng bằng cách chọn các tùy chọn tương ứng trong Hiệu ứng.

        Để quay lại ký tự đã lập mẫu trước đó, nhấp vào nút Quay lại. Khung sẽ chuyển tới vị trí trước và tương ứng "hình ảnh ký tự - ký tự bàn phím" được lập mẫu gần nhất sẽ bị xóa khỏi mẫu. Nút Quay lại điều hướng giữa các ký tự của một từ và sẽ không điều hướng giữa các từ.

        Quan trọng!

              + Bạn chỉ có thể lập mẫu cho ABBYY FineReader đọc các ký tự có trong bảng chữ cái của ngôn ngữ nhận dạng. Để lập mẫu cho chương trình đọc các ký tự không thể nhập từ bàn phím, sử dụng kết hợp hai ký tự để biểu thị những ký tự không tồn tại này hoặc sao chép ký tự mong muốn từ hộp thoại Chèn ký tự (nhấp vào   để mở hộp thoại).

              + Mỗi mẫu có thể chứa tối đa 1.000 ký tự mới. Tuy nhiên, tránh tạo quá nhiều chữ dính vì điều này có thể ảnh hưởng xấu đến chất lượng OCR.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 17 Tháng Tư, 2017, 03:15:47 AM
         
       c. Chọn mẫu người dùng

        ABBYY FineReader cho phép bạn sử dụng mẫu để cải thiện chất lượng OCR

        - Trên menu Công cụ, nhấp vào Trình biên tập mẫu….

        - Trong hộp thoại Trình biên tập mẫu, chọn mẫu mong muốn từ danh sách các mẫu sẵn có và nhấp vào Đặt mẫu hiện hoạt.

        Một số điểm quan trọng cần ghi nhớ:

        - Thay vì phân biệt một số ký tự tương tự là khác nhau, ABBYY FineReader nhận dạng chúng là một ký tự giống nhau. Ví dụ: dấu ngoặc thẳng ('), trái (‘) và phải (’) sẽ được lưu trữ trong một mẫu dưới dạng một ký tự duy nhất (dấu ngoặc thẳng). Điều này có nghĩa là dấu ngoặc trái và phải sẽ không bao giờ được sử dụng trong văn bản được nhận dạng, ngay cả khi bạn cố gắng lập mẫu chúng.

        - Đối với một số hình ảnh ký tự, ABBYY FineReader sẽ chọn ký tự bàn phím tương ứng dựa trên ngữ cảnh xung quanh. Ví dụ: hình ảnh hình tròn nhỏ sẽ được nhận dạng là chữ O nếu có các chữ cái ngay bên cạnh nó và là số 0 nếu có các chữ số bên cạnh nó.

        - Mẫu chỉ có thể được sử dụng cho các tài liệu có phông chữ, cỡ phông và độ phân giải như tài liệu được dùng để tạo mẫu.

        - Để có thể sử dụng một mẫu sau này, lưu mẫu vào một tệp. Xem "Tài liệu FineReader là gì?" để biết chi tiết.

        - Để nhận dạng văn bản được thiết lập trong phông chữ khác, đảm bảo vô hiệu mẫu người dùng bằng cách chọn tùy chọn Chỉ sử dụng mẫu có sẵn trong Công cụ > Tùy chọn… > Đọc.

      d.  Chỉnh sửa mẫu người dùng

        Bạn có thể muốn chỉnh sửa mẫu mới tạo của mình trước khi khởi chạy quy trình OCR. Mẫu được lập không chính xác có thể ảnh hưởng xấu đến chất lượng OCR. Mẫu chỉ được chứa toàn bộ ký tự hoặc chữ dính. Các ký tự có cạnh bị cắt và các ký tự có sự tương ứng chữ cái không chính xác phải được xóa khỏi mẫu.

        - Trên menu Công cụ, nhấp vào Trình biên tập mẫu….

        - Hộp thoại Trình biên tập mẫu sẽ mở ra. Chọn mẫu mong muốn và nhấp vào nút Chỉnh sửa….

        - Trong hộp thoại Mẫu chữ của người dùng mở ra, chọn một ký tự và nhấp vào nút Thuộc tính….

        Trong hộp thoại mở ra:

           + Nhập chữ cái tương ứng với ký tự trong trường Ký tự

           + Chỉ định hiệu ứng phông chữ mong muốn (in đậm, in nghiêng, ký tự trên đầu và ký tự dưới chân) trong trường Hiệu ứng.

        Nhấp vào nút Xóa trong hộp thoại Mẫu chữ của người dùng để xóa ký tự đã được lập mẫu không chính xác.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 18 Tháng Tư, 2017, 06:08:07 AM
        
        10/ Nếu văn bản chứa quá nhiều thuật ngữ chuyên ngành hoặc từ hiếm

        ABBYY FineReader 12 kiểm tra các từ được nhận dạng so với từ điển nội bộ. Nếu văn bản bạn muốn nhận dạng chứa nhiều thuật ngữ chuyên ngành, từ viết tắt và tên, bạn có thể cải thiện độ chính xác nhận dạng bằng cách thêm chúng vào từ điển.

        - Trên menu Công cụ, nhấp Xem từ điển….

        - Trong hộp thoại Từ điển người dùng, chọn ngôn ngữ mong muốn và nhấpXem….

        - Hộp thoại Từ điển sẽ mở. Trong hộp thoại này, nhập một từ và nhấp Thêm hoặc chọn một từ và nhấp Xóa.

        Nếu từ điển đã có từ mà bạn đang định thêm, một thông báo cho biết từ bạn đang định thêm đã có trong từ điển sẽ được hiển thị.
Bạn có thể nhập từ điển người dùng được tạo trong các phiên bản trước của ABBYY FineReader (tức là 9.0, 10 và 11).

        - Trên menu Công cụ, nhấpXem từ điển…, chọn ngôn ngữ mong muốn rồi nhấp Xem…

        - Hộp thoại Từ điển sẽ mở. Trong hộp thoại này, nhấp vào nút Nhập… và chọn tệp từ điển bạn muốn nhập (tệp này phải có phần mở rộng là *.pmd, *.txt hoặc *.dic).

        11/ Nếu chương trình không nhận dạng được một số ký tự

        ABBYY FineReader sử dụng dữ liệu về ngôn ngữ tài liệu khi nhận dạng văn bản. Chương trình có thể không nhận dạng được một số ký tự trong các tài liệu có các thành phần ít gặp (ví dụ: số mã số) vì ngôn ngữ tài liệu có thể không chứa những ký tự này. Để nhận dạng những tài liệu này, bạn có thể tạo ngôn ngữ tùy chỉnh có tất cả các ký tự cần thiết. Bạn cũng có thể gán nhiều ngôn ngữ cho các nhóm ngôn ngữ và sử dụng các nhóm này để nhận dạng.

        Tạo ngôn ngữ người dùng

        - Trên menu Công cụ, nhấp vào Trình biên tập ngôn ngữ…

        - Trong hộp thoại Trình biên tập ngôn ngữ, nhấp vào Mới…

        - Trong hộp thoại mở ra, chọn tùy chọn Tạo ngôn ngữ mới dựa trên ngôn ngữ hiện có, rồi chọn ngôn ngữ sẽ được sử dụng làm cơ sở cho ngôn ngữ mới của bạn và nhấp OK.

        - Hộp thoại Thuộc tính ngôn ngữ sẽ mở ra. Trong hộp thoại này:

                + Nhập tên của ngôn ngữ mới.

                + Ngôn ngữ cơ sở bạn đã chọn trước đây sẽ được hiển thị trong danh sách thả xuống Ngôn ngữ gốc. Bạn có thể thay đổi ngôn ngữ nguồn.

                + Bảng chữ cái chứa bảng chữ cái của ngôn ngữ cơ sở. Nhấp vào nút  nếu bạn muốn chỉnh sửa bảng chữ cái.

                + Có một số tùy chọn liên quan đến Từ điển sẽ được chương trình sử dụng khi nhận dạng văn bản và kiểm tra kết quả:

   * Không: Ngôn ngữ sẽ không có từ điển.

   * Từ điển tích hợp: Từ điển tích hợp của chương trình sẽ được sử dụng.

   * Từ điển của người dùng: Nhấp vào nút Chỉnh sửa… để chỉ định các thuật ngữ trong từ điển hoặc nhập từ điển tùy chỉnh hoặc tệp văn bản sẵn có với mã hóa Windows-1252 (các thuật ngữ phải được tách riêng bằng dấu cách hoặc các ký tự khác không có trong bảng chữ cái).

   Lưu ý: Các từ trong từ điển người dùng sẽ không được đánh dấu là sai khi được kiểm tra chính tả trong văn bản được nhận dạng. Chúng có thể được viết bằng toàn bộ chữ cái viết thường hoặc toàn bộ chữ cái viết hoa hoặc có thể bắt đầu bằng chữ cái viết hoa.

   Từ trong từ điển   Các từ sẽ không được coi là sai khi kiểm tra chính tả

abc   abc, Abc, ABC
Abc   abc, Abc, ABC
ABC   abc, Abc, ABC
aBc   aBc, abc, Abc, ABC

   * Biểu thức thông thường: Bạn có thể tạo từ điển ngôn ngữ tùy chỉnh bằng các biểu thức chính quy. Để biết chi tiết, xem "Biểu thức chính quy".

   * Ngôn ngữ có thể có một vài thuộc tính bổ sung. Để thay đổi những thuộc tính này, nhấp vào nút Nâng cao….

Hộp thoại Thuộc tính ngôn ngữ nâng cao sẽ mở ra. Tại đây bạn có thể chỉ định:

   Các ký tự có thể nằm trong phần đầu hoặc cuối từ
   Các ký tự không phải chữ cái xuất hiện riêng với từ
   Các ký tự có thể xuất hiện ở giữa từ và sẽ được bỏ qua.
   Các ký tự không thể xuất hiện trong văn bản được nhận dạng sử dụng từ điển này (các ký tự bị cấm)
   Tất cả các ký tự có thể nhận dạng từ ngôn ngữ

   Bạn cũng có thể bật tùy chọn Văn bản có thể chứa chữ số Ả Rập, chữ số La Mã và từ viết tắt

        - Bây giờ bạn có thể chọn ngôn ngữ mới được tạo khi chọn ngôn ngữ tài liệu.
 Xem "Các tính năng của tài liệu cần xem xét trước khi OCR" để biết thêm thông tin về ngôn ngữ tài liệu.

        Theo mặc định, ngôn ngữ người dùng được lưu vào thư mục tài liệu FineReader. Bạn cũng có thể lưu ngôn ngữ người dùng và mẫu người dùng dưới dạng một tệp. Để làm như vậy, trên menu Công cụ, nhấp vào Tùy chọn… để mở hộp thoại Tùy chọn, nhấp vào tab Đọc rồi nhấp vào nút Lưu vào tệp....


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 19 Tháng Tư, 2017, 03:44:58 AM
       
        Tạo nhóm ngôn ngữ

        Nếu bạn định sử dụng một kết hợp ngôn ngữ cụ thể thường xuyên, bạn có thể muốn nhóm các ngôn ngữ với nhau cho thuận tiện.

        - Trên menu Công cụ, nhấp vào Trình biên tập ngôn ngữ….

        - Trong hộp thoại Trình biên tập ngôn ngữ, nhấp vào Mới….

        - Trong hộp thoại Nhóm hoặc ngôn ngữ mới, chọn Tạo nhóm ngôn ngữ mới và nhấp OK.

        - Trong hộp thoại Thuộc tính nhóm ngôn ngữ, nhập tên cho nhóm mới của bạn và chọn ngôn ngữ mong muốn.

        Lưu ý: Nếu bạn biết rằng văn bản của mình sẽ không chứa các ký tự nhất định, bạn có thể muốn chỉ định rõ ràng các ký tự bị cấm này. Chỉ định các ký tự bị cấm có thể tăng tốc độ và chất lượng nhận dạng. Để chỉ định các ký tự bị cấm, nhấp vào nút Nâng cao… trong hộp thoại Thuộc tính nhóm ngôn ngữ. Trong hộp thoại Thuộc tính nhóm ngôn ngữ nâng cao, nhập các ký tự bị cấm trong trường Các ký tự bị cấm.

        - Nhấp vào OK.

        Nhóm mới được tạo sẽ được thêm vào danh sách thả xuống Ngôn ngữ của tài liệu trên thanh công cụ chính.

        Theo mặc định, các nhóm ngôn ngữ người dùng được lưu trong thư mục tài liệu FineReader. Bạn cũng có thể lưu ngôn ngữ người dùng và mẫu người dùng dưới dạng một tệp. Để làm như vậy, trên menu Công cụ, nhấp vào Tùy chọn… để mở hộp thoại Tùy chọn, nhấp vào tab Đọc rồi nhấp vào nút Lưu vào tệp….

        Gợi ý: Nếu bạn cần kết hợp ngôn ngữ cụ thể cho tài liệu, bạn cũng có thể chọn ngôn ngữ mong muốn trực tiếp, mà không cần tạo nhóm.

        - Từ danh sách thả xuống Ngôn ngữ của tài liệu, chọn Ngôn ngữ khác….

        - Trong hộp thoại Trình biên tập ngôn ngữ, chọn Chỉ định ngôn ngữ thủ công.

        - Chọn ngôn ngữ mong muốn và nhấp Hủy.

        Nếu văn bản dọc hoặc đảo ngược không được nhận dạng

        Đoạn văn bản được nhận dạng có thể chứa nhiều lỗi nếu hướng của đoạn được phát hiện không chính xác hoặc nếu văn bản trong đoạn bị đảo ngược (nghĩa là văn bản sáng được in trên nền tối).

        Để giải quyết sự cố này:

        - Trong cửa sổ Hình ảnh, chọn vùng hoặc ô bảng chứa văn bản dọc hoặc đảo ngược.

        - Trong ngăn Thuộc tính vùng (nhấp chuột phải vào vùng rồi nhấp vào Thuộc tính trên menu chuột phải để hiển thị ngăn), chọn:

           + Hướng của văn bản từ danh sách thả xuống Hướng của văn bản CJK
hoặc

           + Đảo ngược từ danh sách thả xuống Đảo ngược

        - Chạy lại quy trình OCR.

        Để biết thêm thông tin về các vùng, xem "Nếu vùng được phát hiện không chính xác".


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 20 Tháng Tư, 2017, 03:19:06 PM
       
        VIII -  KIỂM TRA VÀ CHỈNH SỬA VĂN BẢN

        Khi quá trình OCR hoàn tất, văn bản đã được nhận dạng xuất hiện trong cửa sổ Văn bản. Các ký tự được nhận dạng có độ tin cậy thấp sẽ được tô sáng, vì vậy bạn có thể dễ dàng phát hiện lỗi OCR và sửa lỗi.

        Bạn có thể chỉnh sửa văn bản được nhận dạng trực tiếp trong cửa sổ Văn bản hoặc trong hộp thoại Xác minh (nhấp vào Công cụ > Xác minh… để mở hộp thoại). Trong hộp thoại Xác minh, bạn có thể xem lại các từ có độ tin cậy thấp, sửa lỗi chính tả và thêm các từ mới vào từ điển người dùng.

        ABBYY FineReader cũng cho phép bạn thay đổi định dạng của tài liệu đầu ra. Để định dạng văn bản được nhận dạng, sử dụng các nút trên thanh công cụ chính của cửa sổ Văn bản hoặc các nút trên ngăn Thuộc tính văn bản (nhấp chuột phải vào bất kỳ đâu trong cửa sổ Văn bản rồi nhấp vào Thuộc tính trên menu chuột phải để hiển thị ngăn).

        Lưu ý: Khi đọc văn bản, ABBYY FineReader nhận dạng kiểu được dùng trong văn bản. Tất cả các kiểu được nhận dạng sẽ được hiển thị trong ngăn Thuộc tính văn bản. Bạn có thể chỉnh sửa kiểu để nhanh chóng thay đổi định dạng của toàn bộ văn bản. Khi lưu văn bản được nhận dạng thành DOCX, ODT hoặc RTF, tất cả các kiểu sẵn có có thể được giữ nguyên.

        1/ Kiểm tra văn bản trong cửa sổ Văn bản

        Bạn có thể chỉnh sửa văn bản được nhận dạng trực tiếp trong cửa sổ Văn bản hoặc trong hộp thoại Xác minh (nhấp vào Công cụ > Xác minh… để mở hộp thoại). Trong hộp thoại Xác minh, bạn có thể xem lại các từ có độ tin cậy thấp, sửa lỗi chính tả và thêm các từ mới vào từ điển người dùng.

        a) Kiểm tra văn bản trong cửa sổ Văn bản

        Bạn có thể kiểm tra, chỉnh sửa và định dạng kết quả nhận dạng trong cửa sổ Văn bản.

        Thanh công cụ của cửa sổ Văn bản ở phía bên trái cửa sổ có các nút cho phép bạn kiểm tra chính tả. Sử dụng các nút  /  để tới từ hoặc ký tự có độ tin cậy thấp tiếp theo/trước. Nếu các ký tự có độ tin cậy thấp không được tô sáng, nhấp vào nút  trên thanh công cụ của cửa sổ Văn bản.

        Để kiểm tra từ có độ tin cậy thấp trong cửa sổ Văn bản:

        - Nhấp vào từ đó trong cửa sổ Văn bản. Từ sẽ được tô sáng trong cửa sổ Hình ảnh. Đồng thời, cửa sổ Thu phóng sẽ hiển thị hình ảnh được phóng đại của từ.

        - Sửa từ trong cửa sổ Văn bản, nếu cần.
Gợi ý: Bạn có thể chèn các ký hiệu không có trên bàn phím bằng cách nhấp vào nút  . Bạn cũng có thể sử dụng hộp thoại Xác minh.

        Phương pháp này rất tiện lợi khi bạn cần so sánh tài liệu nguồn và tài liệu đầu ra.

        Có thể tìm thấy các công cụ định dạng văn bản trên thanh công cụ trong cửa sổ Văn bản

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBYY13_zpskay9wbr6.jpg)

        Ngăn Thuộc tính văn bản (nhấp chuột phải vào bất kỳ đâu trong cửa sổ Văn bản rồi nhấp vàoThuộc tính trên menu chuột phải để hiển thị ngăn)

        Lưu ý: Sử dụng các nút > và < để di chuyển quanh ngăn Thuộc tính nếu cửa sổ Văn bản quá hẹp và bạn không thể thấy toàn bộ ngăn.

       
        Để tìm hiểu cách bạn có thể thay đổi hình thức của cửa sổ chính và các công cụ có sẵn trên thanh công cụ, vui lòng xem phần "Cửa sổ chính" và "Thanh công cụ".


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 21 Tháng Tư, 2017, 09:59:37 PM

        b) Kiểm tra văn bản được nhận dạng trong hộp thoại Xác minh

        ABBYY FineReader cung cấp hộp thoại Xác minh nơi bạn có thể kiểm tra và sửa các từ chứa các ký tự có độ tin cậy thấp. Để mở hộp thoại Xác minh, nhấp vào  trên thanh công cụ chính hoặc nhấp vào Công cụ > Xác minh…

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBYY14_zpszdhhffil.jpg)

        Trong hộp thoại Xác minh, bạn có thể:

        - Bỏ qua từ được tô sáng mà không thực hiện thay đổi. Khi bạn nhấp vào Bỏ qua, màu đánh dấu sẽ bị xóa.

        - Thay thế từ được tô sáng bằng một trong các biến thể được gợi ý. Chỉ cần chọn gợi ý đúng trong hộp bên phải và nhấp vào Thay thế.

        - Thêm từ được tô sáng vào từ điển bằng cách nhấp vào nút Thêm vào từ điển.
Lần sau khi chương trình gặp phải từ này, nó sẽ không coi đó là lỗi nữa.

         Để biết chi tiết, xem "Làm việc với từ điển người dùng" bên dưới.

        - Thay đổi phông chữ và áp dụng các hiệu ứng phông chữ.

        - Chèn các ký tự không có trên bàn phím vào văn bản. Để chèn một ký tự không có trên bàn phím của bạn, nhấp vào nút  rồi nhấp vào Ký hiệu khác… Trong hộp thoại Ký hiệu, chọn một tập con mong muốn từ danh sách thả xuống Tập con (ví dụ: Chữ Hy Lạp cơ bản hoặc Ký hiệu tiền tệ). Tiếp theo, nhấp đúp vào ký tự bạn muốn chèn. Hoặc, bạn có thể chỉ định mã ký tự Unicode trong hộp Mã ký tự.

        Gợi ý: Để thay đổi tùy chọn kiểm tra, nhấp vào Tùy chọn….

        Khi kiểm tra văn bản được viết bằng Tiếng Trung, Tiếng Nhật hoặc Tiếng Hàn, chương trình sẽ gợi ý các ký tự có hình dạng tương tự cho các ký tự được nhận dạng có độ tin cậy thấp.

(http://i479.photobucket.com/albums/rr153/Giangtvx/moi/ABBYY15_zps2ub4edgz.jpg)
     


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 22 Tháng Tư, 2017, 10:00:09 AM

        c)Làm việc với từ điển người dùng

        Khi đọc văn bản, ABBYY FineReader kiểm tra các từ được nhận dạng so với từ điển. Nếu văn bản chứa quá nhiều thuật ngữ chuyên ngành, từ viết tắt hoặc tên riêng, bạn có thể cải thiện chất lượng OCR bằng cách thêm chúng vào từ điển người dùng.
Lưu ý: Từ điển người dùng có thể không có sẵn đối với một số ngôn ngữ được hỗ trợ.

        Để thêm một từ vào từ điển người dùng, thực hiện một trong các cách sau:

        - Trên menu Công cụ, nhấp vào Xác minh… rồi nhấp vào Thêm vào từ điển trong hộp thoại Xác minh

        - Trong cửa sổ Văn bản, nhấp chuột phải vào từ bạn muốn thêm rồi nhấp vào Thêm vào từ điển trên menu chuột phải.

        Lưu ý: Khi thêm một từ vào từ điển, đảm bảo bạn chọn đúng ngôn ngữ.

        2/ Sử dụng kiểu

        Khi nhận dạng văn bản, ABBYY FineReader sẽ phát hiện các kiểu và định dạng được sử dụng trong tài liệu gốc. Các kiểu và định dạng này được tái tạo trong tài liệu đầu ra. Bạn có thể xem lại và chỉnh sửa kiểu của tài liệu và tạo kiểu mới để định dạng văn bản đã được nhận dạng trong cửa sổ Văn bản.

        Để áp dụng kiểu cho một đoạn văn bản:

        - Chọn đoạn văn bản mong muốn trong cửa sổ Văn bản.

        - Nhấp vào Thuộc tính trên menu chuột phải.

        - Chọn kiểu mong muốn trong danh sách Kiểu trong ngăn Thuộc tính văn bản.

        Lưu ý: Khi lưu văn bản được nhận dạng thành DOCX, ODT hoặc RTF, tất cả các kiểu sẵn có có thể được giữ nguyên. Để biết chi tiết, xem "Lưu tài liệu có thể chỉnh sửa".

        Thay đổi, tạo và trộn kiểu:

        - Trên menu Công cụ, nhấp  Trình biên tập phong cách…

        - Trong hộp thoại Trình biên tập kiểu, chọn kiểu mong muốn và điều chỉnh tên, phông chữ, cỡ phông, khoảng cách ký tự và tỉ lệ của kiểu đó.

        - Để tạo kiểu mới, nhấp Mới. Kiểu mới được tạo sẽ được thêm vào danh sách các kiểu hiện có và tại đây bạn có thể điều chỉnh kiểu.

        - Để trộn nhiều kiểu vào một kiểu, chọn các kiểu để trộn và nhấp Trộn…. Trong hộp thoại Trộn kiểu, chỉ định kiểu để trộn các kiểu đã chọn.

        - Nhấp Lưu để lưu thay đổi.

        Bạn có thể điều hướng giữa các đoạn văn bản được in theo kiểu giống nhau. Trong Trình biên tập kiểu, chọn kiểu mong muốn và nhấp vào Đoạn trước hoặc Đoạn tiếp theo.

        3/ Chỉnh sửa siêu liên kết

        ABBYY FineReader phát hiện các siêu liên kết và tái tạo địa chỉ đích của chúng trong tài liệu đầu ra. Các siêu liên kết được phát hiện được gạch chân và hiển thị bằng màu xanh.

        Khi xem tài liệu đã được nhận dạng trong cửa sổ Văn bản ,đặt con trỏ chuột lên một siêu liên kết để xem địa chỉ của siêu liên kết đó. Để truy cập một siêu liên kết, nhấp vào Mở siêu liên kết từ menu chuột phải hoặc bấm Ctrl và nhấp chuột trái vào siêu liên kết.

        Để thêm, xóa hoặc thay đổi văn bản hoặc địa chỉ của một siêu liên kết:

        - Trong cửa sổ Văn bản, chọn văn bản của siêu liên kết mong muốn.

        - Để xóa bỏ một siêu liên kết, nhấp chuột phải vào siêu liên kết đó rồi nhấp Xóa siêu liên kết từ menu chuột phải.

        - Để thêm hoặc thay đổi một siêu liên kết, nhấp Siêu liên kết… trong menu chuột phải hoặc nhấp  trên thanh công cụ chính nằm ở đầu cửa sổ Văn bản. Trong hộp thoại Chỉnh sửa siêu liên kết, bạn có thể:

           + Chỉnh sửa văn bản của liên kết trong trường Văn bản hiển thị.

           + Chọn hoặc thay đổi loại siêu liên kết trong nhóm Liên kết tới:

                 * Chọn Trang web để liên kết tới một trang Internet.
Trong trường Địa chỉ, chỉ định giao thức và URL của trang đó (ví dụ: http://www.abbyy.com).

                 * Chọn Tệp cục bộ để liên kết tới một tệp.
Nhấp Duyệt… để duyệt tìm tệp mà siêu liên kết sẽ trỏ tới (ví dụ: tệp://D:/MyDocuments/ABBYY FineReaderGuide.pdf).

                 * Chọn Địa chỉ email để người dùng có thể dễ dàng gửi thư email tới địa chỉ có trong siêu liên kết bằng cách nhấp vào siêu liên kết.
Trong trường Địa chỉ, chỉ định giao thức và địa chỉ email (ví dụ: mailto:office@abbyy.com).


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 23 Tháng Tư, 2017, 09:31:36 AM

        4/ Chỉnh sửa bảng

        ABBYY FineReader cho phép bạn chỉnh sửa các bảng đã được nhận dạng trong cửa sổ Văn bản. Hiện có các lệnh sau:

        - Hợp nhất ô bảng: Sử dụng chuột để chọn các ô bảng cần hợp nhất rồi nhấp Hợp nhất ô bảng từ menu Chỉnh sửa.

        - Tách ô bảng: Nhấp vào ô bảng cần tách rồi nhấp vào Tách ô bảng trên menu Chỉnh sửa.

        Quan trọng! Lệnh này chỉ có thể áp dụng cho các ô bảng đã được hợp nhất trước đó.

        - Hợp nhất các hàng trong bảng: Sử dụng chuột để chọn các hàng trong bảng cần hợp nhất rồi nhấp Hợp nhất dòng bảng từ menu Chỉnh sửa.

        - Xóa nội dung ô: Chọn ô hoặc các ô có nội dung bạn muốn xóa và bấm vào nút Xóa.

        Lưu ý: Theo mặc định, các công cụ chỉnh sửa bảng không được hiển thị trên thanh công cụ. Bạn có thể thêm các công cụ chỉnh sửa bảng vào thanh công cụ trong hộp thoại Tùy chỉnh thanh công cụ và lối tắt (nhấp vào Công cụ > Tùy chỉnh… để mở hộp thoại).

          Để biết hướng dẫn chi tiết về cách thêm các nút vào thanh công cụ, vui lòng tham khảo phần "Thanh công cụ".

        5/ Xóa thông tin mật

        Với ABBYY FineReader 12, bạn có thể dễ dàng xóa bỏ thông tin mật khỏi một văn bản đã được nhận dạng. 

        - Trên menu Công cụ, nhấp Chế độ soạn thảo hoặc nhấp vào nút  trên thanh công cụ chính.

        - Trong cửa sổ Văn bản, sử dụng bút dấu để bôi đen văn bản bạn muốn giấu.

        Gợi ý: Nếu bạn vô tình bôi đen một số ký tự, bạn có thể hoàn tác thao tác soạn thảo cuối cùng bằng cách nhấn Ctrl+Z hoặc nhấp Hoàn tác trên thanh công cụ chính.

        - Lưu tài liệu của bạn.

        Văn bản được soạn thảo sẽ xuất hiện dưới dạng các dấu chấm trong tài liệu đầu ra. Nếu định dạng lưu bạn chọn hỗ trợ màu văn bản và màu nền, ký tự hiển thị sẽ là những hình chữ nhật màu đen.

        Để tắt chế độ Soạn thảo, thực hiện một trong hai cách

        - Trên menu Công cụ, nhấp lại vào Chế độ soạn thảo hoặc

        - Nhấp vào nút  trên thanh công cụ chính

        IX - SAO CHÉP NỘI DUNG

        ABBYY FineReader cho phép bạn sao chép văn bản, ảnh và bảng từ tài liệu và dán vào các ứng dụng khác. Bạn có thể sao chép nội dung từ các trang và hình ảnh được quét mà không cần nhận dạng toàn bộ tài liệu hoặc chuyển đổi thành định dạng có thể chỉnh sửa. Nội dung đã chọn sẽ được sao chép vào bộ nhớ tạm và có thể được dán vào bất kỳ ứng dụng nào hỗ trợ dán từ bộ nhớ tạm.

         Phần "Thêm ảnh mà không xử lý" giải thích cách mở tài liệu trong ABBYY FineReader mà không nhận dạng tài liệu.

        Để sao chép nội dung:

        - Sử dụng công cụ trong cửa sổ Hình ảnh để chọn phần tài liệu bạn muốn sao chép.

        - Nhấp vào nút  trên thanh công cụ bật lên hoặc nhấp chuột phải vào vùng đã chọn rồi nhấp vào Đọc và sao chép vào Khay nhớ tạm trên menu chuột phải.

        - Dán nội dung vào ứng dụng khác.

        Để sao chép một vài trang:

        - Chọn các trang bạn muốn sao chép trong ngăn Trang.

        - Nhấp chuột phải vào các trang đã chọn, nhấp vào Lưu trang đã chọn dưới dạng hoặc Gửi trang được chọn đến… trên menu chuột phải, rồi chọn ứng dụng mà bạn muốn chèn trang vào.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 24 Tháng Tư, 2017, 02:18:38 AM
        
X - LƯU KẾT QUẢ OCR


        Kết quả nhận dạng có thể được lưu vào một tệp, gửi đến một ứng dụng khác, sao chép sang bộ nhớ tạm hoặc gửi qua email. Bạn cũng có thể gửi kết quả OCR đến máy chủ Kindle.com, nơi chúng sẽ được chuyển đổi thành định dạng Kindle và trở nên có sẵn để tải xuống thiết bị Kindle của bạn. Bạn có thể lưu toàn bộ tài liệu, hoặc chỉ các trang được chọn.

        Quan trọng! Đảm bảo chọn các tùy chọn lưu thích hợp trước khi nhấp Lưu.

        Để lưu văn bản được nhận dạng:

        - Trên thanh công cụ chính, chọn chế độ lưu bố cục tài liệu từ danh sách thả xuống Bố cục tài liệu. Lưu ý: Các định dạng tệp khả dụng được liệt kê bên dưới mỗi chế độ.

        Chế độ lưu định dạng:

           + Bản sao chính xác: Tạo tài liệu với định dạng tương ứng với định dạng của tài liệu gốc. Được đề xuất cho tài liệu có định dạng phức tạp, như tập sách quảng cáo. Tuy nhiên, lưu ý rằng tùy chọn này giới hạn khả năng thay đổi văn bản và định dạng của tài liệu đầu ra.

           + Bản sao có thể chỉnh sửa: Tạo tài liệu có định dạng có thể hơi khác với định dạng của tài liệu gốc. Tài liệu được tạo ở chế độ này dễ dàng chỉnh sửa.

           + Văn bản có định dạng: Giữ lại phông chữ, cỡ phông và đoạn nhưng không giữ lại chính xác dấu cách và vị trí của các đối tượng trên trang. Văn bản được tạo sẽ được căn trái. Văn bản trong hệ chữ từ phải sang trái sẽ được căn phải. Lưu ý: Văn bản dọc sẽ được thay đổi thành ngang trong chế độ này.

           + Văn bản thuần túy: Chế độ này không giữ lại định dạng văn bản.

           + Bố cục linh hoạt: Tạo tài liệu HTML với vị trí của đối tượng gần nhất với vị trí gốc nếu có thể về mặt kỹ thuật.

        - Trên tab Lưu của hộp thoại Tùy chọn, chọn tùy chọn lưu mong muốn và nhấp OK.

        - Nhấp vào mũi tên bên phải nút Lưu trên thanh công cụ chính và chọn tùy chọn thích hợp hoặc sử dụng các lệnh trên menu Tệp.

        Lưu ý: ABBYY FineReader cho phép bạn lưu trang dưới dạng hình ảnh. Để biết chi tiết, xem Lưu hình ảnh của trang.

        Các ứng dụng được hỗ trợ:

           + Microsoft Word 2003 (11.0), 2007 (12.0), 2010 (14.0) và 2013 (15.0)

           + Microsoft Excel 2003 (11.0), 2007 (12.0), 2010 (14.0) và 2013 (15.0)

           + Microsoft PowerPoint 2003 (11.0) (với Gói tương thích Microsoft Office cho định dạng tệp Word, Excel và PowerPoint), 2007 (12.0), 2010 (14.0) và 2013 (15.0)

           + Apache OpenOffice Writer 3.4, 4.0

           + Corel WordPerfect X5, X6

           + Adobe Acrobat/Reader (8.0 và mới hơn)

        Lưu ý: Để đảm bảo khả năng tương thích tốt nhất giữa ABBYY FineReader và các ứng dụng được liệt kê ở trên, đảm bảo bạn cài đặt bản cập nhật mới nhất sẵn có của các ứng dụng này.

        1/ Lưu tài liệu có thể chỉnh sửa

        ABBYY FineReader cho phép bạn lưu dữ liệu từ hình ảnh được nhận dạng trong các định dạng có thể chỉnh sửa. Khi chọn một định dạng, xám xét cách bạn định sử dụng tài liệu.

           + Lưu tài liệu ở định dạng DOCX/ODT/RTF

           + Lưu tài liệu ở định dạng PPTX

           + Lưu văn bản thuần túy (TXT)

        Lưu ở định dạng DOCX/ODT/RTF

        Để lưu văn bản của bạn ở định dạng DOCX/DOC/RTF/ODT:

        - Nhấp vào mũi tên bên cạnh nút Lưu trên thanh công cụ chính rồi nhấp vào định dạng mong muốn. Nếu định dạng bạn cần không hiển thị trong danh sách, nhấp vào Lưu ở định dạng khác… rồi chọn định dạng mong muốn từ danh sách thả xuống Loại lưu dưới dạng. Hoặc, trên menu Tệp, nhấp vào Lưu tài liệu dưới dạng rồi nhấp vào định dạng lưu mong muốn.

        Gợi ý: Các tùy chọn lưu bổ sung sẵn có trong hộp thoại Tùy chọn: nhấp vào Công cụ > Tùy chọn…, nhấp vào tab Lưu rồi nhấp vào tab RTF/DOCX/ODT.

        Các tùy chọn lưu trong tab này được nhóm vào các danh mục sau:

        Bố cục tài liệu: Tùy thuộc vào cách bạn định sử dụng tài liệu điện tử, chọn một trong các tùy chọn sau đây:

        - Bản sao chính xác: Tạo một tài liệu duy trì định dạng của tài liệu gốc. Tùy chọn này được đề xuất đối với các tài liệu có bố cục phức tạp, như sách quảng cáo. Tuy nhiên, lưu ý rằng tùy chọn này giới hạn khả năng thay đổi văn bản và định dạng của tài liệu đầu ra.

        - Bản sao có thể chỉnh sửa: Tạo tài liệu gần như giữ lại định dạng gốc và luồng văn bản nhưng cho phép chỉnh sửa dễ dàng.

        - Văn bản có định dạng: Giữ lại phông chữ, cỡ phông và đoạn nhưng không giữ lại vị trí chính xác của đối tượng trên trang hoặc khoảng cách dòng. Văn bản thu được sẽ được căn trái (văn bản từ phải sang trái sẽ được căn phải). Lưu ý: Văn bản dọc sẽ được thay đổi thành ngang trong chế độ này.

        - Văn bản thuần túy
Chế độ này không giữ lại định dạng. Kiểu phông chữ sẽ được giữ nguyên nếu tùy chọn Giữ lại kiểu văn bản in đậm, in nghiêng và gạch chân trong văn bản thuần túy được bật.

        Cỡ giấy mặc định: Bạn có thể chọn cỡ giấy dùng để lưu ở định dạng RTF, DOC, DOCX hoặc ODT từ danh sách thả xuống Cỡ giấy mặc định.

        Cài đặt văn bản

        - Giữ lại ngắt dòng và dấu gạch nối: Giữ lại hàng tiêu đề lớn (đầu trang và chân trang) trong văn bản đầu ra.

        - Giữ ngắt trang: Giữ lại sắp xếp trang ban đầu.

        - Giữ số dòng: Giữ lại đánh số dòng ban đầu (nếu có). Số dòng sẽ được lưu vào một trường riêng không thay đổi khi bạn chỉnh sửa văn bản. Lưu ý: Tính năng này chỉ khả dụng nếu Bản sao chính xác hoặc Bản sao có thể chỉnh sửa được chọn.

        - Giữ lại đầu trang, chân trang và số trang: Giữ lại đầu trang, chân trang và ngắt trang trong văn bản đầu ra.

        - Giữ lại kiểu văn bản in đậm, in nghiêng và gạch chân trong văn bản thuần túy: Giữ lại kiểu văn bản khi lưu trong chế độ Văn bản thuần túy.

        - Giữ màu văn bản và nền: Giữ màu gốc của chữ cái.

        Lưu ý: Nếu tắt phát hiện thành phần cấu trúc (đầu trang, chân trang, chú thích cuối trang, mục lục và danh sách đánh số), những thành phần này sẽ được lưu dưới dạng nội dung văn bản. Những cài đặt này được tìm thấy trên tab Đọc của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

        Cài đặt hình ảnh: Tài liệu chứa một số lượng lớn ảnh quá lớn. Để giảm kích cỡ tệp, chọn tùy chọn mong muốn trong nhóm Cài đặt ảnh.

        Gợi ý:

        - Để thay đổi các tham số lưu ảnh, nhấp vào Tùy chỉnh…. Trong hộp thoại Cài đặt tùy chỉnh, chọn các tham số mong muốn và nhấp ОК.

        - Nếu bạn không muốn giữ lại ảnh trong văn bản được nhận dạng, đảm bảo tùy chọn Giữ lại ảnh không được chọn.

        Nâng cao

        Chọn tùy chọn Tô sáng các ký tự có độ tin cậy thấp nếu bạn muốn chỉnh sửa văn bản được nhận dạng trong Microsoft Word thay vì cửa sổ Văn bản trong ABBYY FineReader. Nếu tùy chọn này được chọn, tất cả các ký tự độ tin cậy thấp sẽ được tô sáng trong tài liệu Microsoft Word.

        Gợi ý: Bạn có thể thay đổi màu của các ký tự không chắc chắn trên tab Xem của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 25 Tháng Tư, 2017, 05:49:12 AM
   
        Lưu ở định dạng PPTX

        Để lưu văn bản của bạn ở định dạng PPTX: Trên menu Tệp, nhấp vào Lưu tài liệu dưới dạng, rồi nhấp vào Trình bày Microsoft PowerPoint. Hoặc, nhấp vào mũi tên bên cạnh nút Lưu trên thanh công cụ chính rồi nhấp vào Lưu dưới dạng PPTX. Nếu định dạng bạn cần không hiển thị trong danh sách, nhấp vào Lưu ở định dạng khác… rồi chọn định dạng mong muốn từ danh sách thả xuống Loại lưu dưới dạng.

        Gợi ý: Các tùy chọn lưu bổ sung sẵn có trong hộp thoại Tùy chọn: nhấp vào Công cụ > Tùy chọn…, nhấp vào tab Lưu rồi nhấp vào tab PPTX.

        Các tùy chọn lưu trong tab này được nhóm vào các danh mục sau:

        Cài đặt văn bản

                + Giữ ngắt dòng: Giữ cách sắp xếp các dòng gốc.

                + Ngắt dòng: Tất cả văn bản được nhận dạng đều vừa vặn hoàn toàn trong khối văn bản trong slide.

                + Giữ lại đầu trang và chân trang: Giữ nguyên đầu trang và chân trang trong tài liệu đầu ra.

        Cài đặt hình ảnh: Tài liệu chứa một số lượng lớn ảnh quá lớn. Để giảm kích cỡ tệp, chọn tùy chọn mong muốn trong nhóm Chất lượng hình ảnh.

        Gợi ý:

                + Để thay đổi các tham số lưu ảnh, nhấp vào Tùy chỉnh…. Trong hộp thoại Cài đặt tùy chỉnh, chọn các tham số mong muốn và nhấp vào OK.

                + Nếu bạn không muốn giữ lại ảnh trong văn bản được nhận dạng, đảm bảo tùy chọn Giữ lại ảnh không được chọn.

        Lưu ở định dạng TXT

        Để lưu văn bản của bạn ở định dạng TXT: Trên menu Tệp, nhấp vào Lưu tài liệu dưới dạng rồi nhấp vào Tài liệu văn bản. Hoặc, nhấp vào mũi tên bên cạnh nút Lưu trên thanh công cụ chính rồi nhấp vào Lưu dưới dạng TXT. Nếu định dạng bạn cần không hiển thị trong danh sách, nhấp vào Lưu ở định dạng khác… rồi chọn định dạng mong muốn từ danh sách thả xuống Loại lưu dưới dạng.

        Gợi ý: Các tùy chọn lưu bổ sung sẵn có trong hộp thoại Tùy chọn: nhấp vào Công cụ > Tùy chọn…, nhấp vào tab Lưu rồi nhấp vào tab TXT.

        Các tùy chọn lưu trong tab này được nhóm vào các danh mục sau:

        Bố cục tài liệu: Tùy thuộc vào cách bạn định sử dụng tài liệu điện tử, chọn một trong các tùy chọn sau đây:

                + Văn bản có định dạng: Giữ lại các đoạn nhưng không giữ lại khoảng cách dòng và vị trí chính xác của đối tượng. Ngoài ra, sử dụng khoảng trắng để tạo thụt đầu dòng đoạn và bảng. Văn bản thu được sẽ được căn trái (văn bản từ phải sang trái sẽ được căn phải).

        Lưu ý: Văn bản dọc sẽ được thay đổi thành ngang trong chế độ này.

                + Văn bản thuần túy: Chế độ này không giữ lại định dạng.

        Cài đặt văn bản

                + Giữ ngắt dòng: Giữ cách sắp xếp các dòng gốc. Nếu tùy chọn này không được chọn, văn bản sẽ được lưu thành một dòng.

                + Chèn ký tự ngắt trang (#12) làm ngắt trang: Lưu cách sắp xếp trang gốc.

                + Sử dụng dòng trống làm dấu phân cách đoạn.Tách đoạn bằng các dòng trống.

                + Giữ lại đầu trang và chân trang: Giữ nguyên đầu trang và chân trang trong tài liệu đầu ra.

        Mã hóa: ABBYY FineReader phát hiện bảng mã tự động. Để thay đổi bảng mã, chọn bảng mã mong muốn từ danh sách thả xuống trong Mã hóa.


Tiêu đề: Re: Số hóa sách với ABBYY FineReader
Gửi bởi: Giangtvx trong 26 Tháng Tư, 2017, 01:18:31 AM

        2/ Lưu bảng

        ABBYY FineReader cho phép bạn lưu bảng trong các định dạng XLS, XLSX và CSV.

        XLS và XLSX

        Để lưu văn bản của bạn trong định dạng XLS hoặc XLSX: Nhấp vào mũi tên bên cạnh nút Lưu trên thanh công cụ chính rồi nhấp vào Lưu thành trang tính Microsoft Excel… hoặc Lưu thành trang tính Microsoft Excel 97-2003… Nếu định dạng bạn cần không hiển thị trong danh sách, nhấp vào Lưu ở định dạng khác… rồi chọn định dạng mong muốn từ danh sách thả xuống Loại lưu dưới dạng. Hoặc, trên menu Tệp, nhấp vào Lưu tài liệu dưới dạng, rồi nhấp vào Bảng tính Microsoft Excel 97-2003.

        Gợi ý: Các tùy chọn lưu bổ sung sẵn có trong hộp thoại Tùy chọn: nhấp vào Công cụ > Tùy chọn…, nhấp vào tab Lưu rồi nhấp vào tab XLSX.

        Hiện có các tùy chọn sau:

        Bố cục tài liệu: Chọn một trong các tùy chọn sau từ danh sách thả xuống này dựa trên cách bạn định sử dụng tài liệu:

        - Văn bản có định dạng: Giữ nguyên phông chữ, cỡ phông và đoạn, nhưng không giữ nguyên vị trí chính xác của các đối tượng và khoảng cách dòng. Bạn sẽ nhận được văn bản được căn trái liên tục (văn bản được in bằng chữ viết từ trái sang phải sẽ được căn phải).

        Lưu ý: Mọi văn bản dọc sẽ được hiển thị ngang nếu tùy chọn này được chọn.

        - Văn bản thuần túy: Không giữ nguyên định dạng văn bản.

        Cài đặt văn bản

        - Bỏ qua văn bản nằm ngoài bảng: Chỉ lưu bảng và bỏ qua phần còn lại.

        - Chuyển đổi giá trị dạng số sang số" Chuyển số sang định dạng "Số" trong tệp XLS. Microsoft Excel có thể thực hiện các thao tác số học trong ô của định dạng này.

        - Giữ lại đầu trang và chân trang: Giữ nguyên đầu trang và chân trang trong tài liệu đầu ra.

        - Tạo bảng tính riêng cho mỗi trang (chỉ XLSX): Chọn tùy chọn này để lưu các trang từ tài liệu nguồn dưới dạng bảng tính riêng.

        Cài đặt hình ảnh: Bạn có thể lưu ảnh trong tài liệu XLSX. Tài liệu chứa một số lượng lớn ảnh quá lớn. Để giảm kích cỡ tệp, chọn tùy chọn mong muốn từ danh sách thả xuống trong nhóm Cài đặt hình ảnh.

        Gợi ý:

        - Nếu bạn muốn chỉ định phạm vi tham số chất lượng ảnh rộng hơn, chọn Tùy chỉnh… và thay đổi cài đặt trong hộp thoại Cài đặt tùy chỉnh.

        - Nếu bạn không muốn giữ lại ảnh trong văn bản được nhận dạng, đảm bảo tùy chọn Giữ lại ảnh (chỉ XLSX) không được chọn.

        CSV: Để lưu văn bản của bạn ở định dạng CSV:  Trên menu Tệp, nhấp vào Lưu tài liệu dưới dạng rồi nhấp vào Tài liệu CSV. Hoặc, nhấp vào mũi tên bên cạnh nút Lưu trên thanh công cụ chính rồi nhấp vào Lưu dưới dạng CSV. Nếu định dạng bạn cần không hiển thị trong danh sách, nhấp vào Lưu ở định dạng khác… rồi chọn định dạng mong muốn từ danh sách thả xuống Loại lưu dưới dạng.

        Gợi ý: Các tùy chọn lưu bổ sung sẵn có trong hộp thoại Tùy chọn: chọn Công cụ > Tùy chọn…, nhấp vào tab Lưu rồi nhấp vào tab CSV.

        Các tùy chọn lưu trong tab này được nhóm vào các danh mục sau:

        Cài đặt văn bản

        - Bỏ qua văn bản nằm ngoài bảng: Chỉ lưu bảng và bỏ qua phần còn lại.

        - Chèn ký tự ngắt trang (#12) làm dấu phân cách trang. Lưu cách sắp xếp trang gốc.

        - Dấu phân cách trường: Chọn ký tự sẽ phân tách các cột dữ liệu trong tệp CSV.

        Mã hóa

        ABBYY FineReader phát hiện bảng mã tự động. Để thay đổi bảng mã, chọn bảng mã mong muốn từ danh sách thả xuống trong Mã hóa.