Dựng nước - Giữ nước
Tin tức: Offline QKTĐ
 
*
Chào Khách. Bạn có thể đăng nhập hoặc đăng ký. 13 Tháng Mười Hai, 2017, 05:50:29 PM


Đăng nhập với Tên truy nhập, Mật khẩu và thời gian tự động thoát


Trang: « 1 2 3 4 5 6 7 »   Xuống
  In  
Tác giả Chủ đề: Số hóa sách với ABBYY FineReader  (Đọc 7023 lần)
0 Thành viên và 1 Khách đang xem chủ đề.
Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #10 vào lúc: 23 Tháng Ba, 2017, 05:08:57 AM »


        5/ Mở hình ảnh hoặc tài liệu PDF

        ABBYY FineReader 12 cho phép bạn mở tệp PDF và tệp hình ảnh trong các định dạng được hỗ trợ.

        Hoàn thành các bước sau để mở tệp PDF hoặc tệp hình ảnh:

­        - Nhấp vào nút Mở trên thanh công cụ chính hoặc nhấp vào Mở tệp PDF hoặc hình ảnh… trên menu Tệp.

­­        - Chọn một hoặc nhiều tệp từ hộp thoại mở ra. Nếu bạn chọn tệp có nhiều trang, bạn có thể chỉ định phạm vi trang bạn muốn mở.

­­        - Bật tùy chọn Tự động xử lý các trang khi chúng được thêm vào nếu bạn muốn tự động xử lý sơ bộ ảnh.

­        Gợi ý: Hộp thoại Tùy chọn cho phép bạn chọn cách xử lý sơ bộ ảnh: lỗi nào sẽ được xóa bỏ, tài liệu sẽ được phân tích hay không, v.v.. Để mở hộp thoại Tùy chọn, nhấp vào nút Tùy chọn…. Để biết thêm về cài đặt xử lý sơ bộ, xem " Các tùy chọn quét và mở".

        Lưu ý: Nếu có tài liệu FineReader đang mở khi bạn mở hình ảnh trang hoặc tài liệu mới, các trang mới sẽ được thêm vào cuối tài liệu FineReader này. Nếu không có tài liệu FineReader nào đang mở, một tài liệu mới sẽ được tạo từ các trang mới.

         Bạn có thể tìm thêm thông tin về tài liệu FineReader và các trang trong phần "Tài liệu FineReader là gì?".

        Lưu ý: Quyền truy cập vào một số tài liệu PDF bị tác giả của tài liệu hạn chế. Những hạn chế này bao gồm bảo vệ bằng mật khẩu, hạn chế mở tài liệu và hạn chế sao chép nội dung. Khi mở những tệp này, ABBYY FineReader có thể yêu cầu mật khẩu.

        Các tùy chọn quét và mở

        Để tùy chỉnh quá trình quét và mở các trang trong ABBYY FineReader, bạn có thể:

        - Bật/tắt tự động phân tích và nhận dạng các trang mới được thêm vào
        - Chọn các tùy chọn xử lý sơ bộ ảnh khác nhau

        - Chọn giao diện quét

        Bạn có thể truy cập những cài đặt này từ các hộp thoại cho mở và quét tài liệu (nếu bạn đang sử dụng giao diện quét của ABBYY FineReader 12) và trên tab Quét/Mở của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

        Quan trọng! Mọi thay đổi bạn thực hiện trong hộp thoại Tùy chọn sẽ chỉ được áp dụng cho hình ảnh mới được quét/mở.

        Tab Quét/Mở của hộp thoại Tùy chọn có các tùy chọn sau:

        Cài đặt tự động phân tích và nhận dạng

        Theo mặc định, tài liệu FineReader được phân tích và nhận dạng tự động, nhưng bạn có thể thay đổi cách xử lý này. Hiện có các chế độ sau:

           + Đọc hình ảnh trang (bao gồm tiền xử lý hình ảnh): Mọi hình ảnh được thêm vào tài liệu FineReader được xử lý sơ bộ tự động sử dụng các cài đặt từ nhóm tùy chọn Xử lý hình ảnh. Phân tích và nhận dạng cũng được thực hiện tự động.

                + Phân tích hình ảnh trang (bao gồm tiền xử lý hình ảnh): Xử lý sơ bộ ảnh và phân tích tài liệu được thực hiện tự động, nhưng nhận dạng phải được bắt đầu thủ công.

           + Tiền xử lý hình ảnh trang: Chỉ xử lý sơ bộ được thực hiện tự động. Phân tích và nhận dạng phải được bắt đầu bằng tay. Chế độ này thường được sử dụng cho các tài liệu có cấu trúc phức tạp.

        Nếu bạn không muốn hình ảnh bạn thêm vào tài liệu FineReader được xử lý tự động, bỏ chọn Tự động xử lý các trang khi chúng được thêm vào. Tùy chọn này cho phép bạn mở nhanh các tài liệu lớn, chỉ nhận dạng các trang nhất định trong tài liệu và lưu tài liệu dưới dạng hình ảnh.
Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #11 vào lúc: 23 Tháng Ba, 2017, 02:02:42 PM »

       
        6/ Các tùy chọn xử lý sơ bộ ảnh

        ABBYY FineReader 12 cho phép bạn tự động xóa bỏ các lỗi ảnh quét và ảnh kỹ thuật số phổ biến.

        Xử lý chung

        - Tách các trang đối diện: Chương trình sẽ tự động tách hình ảnh chứa các trang đối diện thành hai hình ảnh chứa từng trang.

        - Phát hiện hướng trang: Hướng của các trang được thêm vào tài liệu FineReader sẽ được phát hiện tự động và sửa nếu cần.

        - Chỉnh ảnh nghiêng: Các trang bị nghiêng sẽ được phát hiện tự động và chỉnh ảnh nghiêng nếu cần.

        - Sửa biến dạng hình thang: Chương trình sẽ tự động phát hiện biến dạng hình thang và dòng văn bản không đều trên ảnh kỹ thuật số và ảnh quét của sách. Những lỗi này sẽ được sửa khi thích hợp.

        - Sửa thẳng các dòng văn bản: Chương trình sẽ tự động phát hiện các dòng văn bản không đều trên hình ảnh và nắn thẳng mà không sửa biến dạng hình thang.

        - Đảo ngược hình ảnh: Khi thích hợp, ABBYY FineReader 12 sẽ đảo ngược màu hình ảnh sao cho hình ảnh chứa văn bản tối trên nền sáng.

        - Xóa dấu màu: Chương trình sẽ phát hiện và xóa bất kỳ nhãn màu hoặc dấu màu nào được thực hiện bằng bút để hỗ trợ nhận dạng văn bản bị che bởi các dấu này. Công cụ này được thiết kế cho các tài liệu được quét có văn bản tối trên nền trắng. Không chọn tùy chọn này cho ảnh và tài liệu kỹ thuật số có nền màu.

        - Sửa độ phân giải hình ảnh: ABBYY FineReader 12 sẽ tự động phát hiện độ phân giải tốt nhất cho hình ảnh và sẽ thay đổi độ phân giải của hình ảnh khi cần.

        Sửa ảnh

        - Phát hiện cạnh trang: Đôi khi, ảnh kỹ thuật số có các đường viền không chứa dữ liệu hữu ích nào. Chương trình sẽ phát hiện những đường viền này và xóa chúng.

        - Làm trắng nền: ABBYY FineReader sẽ làm trắng nền và chọn độ sáng tốt nhất cho hình ảnh.

        - Giảm nhiễu ISO: Nhiễu sẽ tự động được khử khỏi ảnh chụp.

        - Xóa mờ do chuyển động: Độ sắc nét của ảnh kỹ thuật số bị mờ sẽ được nâng cao.

        Lưu ý: Bạn có thể tắt tất cả những tùy chọn này khi quét hoặc mở các trang tài liệu và vẫn áp dụng bất kỳ tính năng xử lý sơ bộ mong muốn nào trong Biên tập ảnh. Để biết chi tiết, xem "Xử lý sơ bộ ảnh".

        Quét giao diện


        Theo mặc định, ABBYY FineReader sử dụng giao diện quét riêng. Hộp thoại quét có các tùy chọn sau:

        - Độ phân giải, Chế độ quét và Độ sáng.

        - Cài đặt giấy.

        - Xử lý hình ảnh.

        Gợi ý: Bạn có thể chọn bật tính năng xử lý sơ bộ nào, lỗi nào sẽ được xóa bỏ và tài liệu có được tự động phân tích và nhận dạng hay không. Để làm như vậy, bật tùy chọn Tự động xử lý các trang khi chúng được thêm vào và nhấp vào nút Tùy chọn….

        - Quét nhiều trang:

           + Sử dụng khay nạp tài liệu tự động (ADF)

           + Quét hai mặt

           + Đặt thời gian hẹn giờ quét trang tính bằng giây

        Nếu giao diện quét của ABBYY FineReader 12 không tương thích với máy quét của bạn, bạn có thể sử dụng giao diện nguyên bản của máy quét. Tài liệu của máy quét sẽ chứa mô tả về hộp thoại này và các thành phần trong hộp thoại.
Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #12 vào lúc: 25 Tháng Ba, 2017, 08:09:38 AM »

        
       Xử lý sơ bộ ảnh tự động

        Các dòng văn bản bị biến dạng, nghiêng, nhiễu và các lỗi khác thường thấy trên hình ảnh quét và ảnh kỹ thuật số có thể làm giảm chất lượng nhận dạng. ABBYY FineReader có thể xóa bỏ những lỗi này tự động và cũng cho phép bạn xóa bỏ chúng thủ công.

        ABBYY FineReader có một vài tính năng xử lý sơ bộ ảnh. Nếu những tính năng này được bật, chương trình tự động xác định cách cải thiện hình ảnh dựa trên loại hình ảnh và áp dụng mọi tính năng tăng cường ảnh cần thiết: khử nhiễu, sửa nghiêng, nắn thẳng dòng văn bản và sửa biến dạng hình thang.

        Lưu ý: Những thao tác này có thể mất thời gian đáng kể.

        Hoàn thành các bước bên dưới nếu bạn muốn ABBYY FineReader 12 tự động xử lý sơ bộ tất cả ảnh được mở hoặc quét.

        - Mở hộp thoại Tùy chọn (Công cụ >Tùy chọn…).

        - Nhấp vào tab Quét/Mở và đảm bảo tùy chọn Tự động xử lý các trang khi chúng được thêm vào trong nhóm Chung được bật và các tùy chọn cần thiết được chọn trong nhóm Xử lý sơ bộ ảnh.

        Lưu ý: Bạn cũng có thể bật và tắt xử lý sơ bộ ảnh tự động trong hộp thoại Mở hình ảnh (Tệp >Mở tệp PDF hoặc hình ảnh…) và trong hộp thoại quét.

        Chỉnh sửa hình ảnh thủ công: Bạn có thể tắt xử lý sơ bộ tự động và chỉnh sửa hình ảnh thủ công trong Biên tập ảnh. Làm theo hướng dẫn bên dưới để chỉnh sửa hình ảnh thủ công:




        - Mở Biên tập ảnh bằng cách nhấp vào Chỉnh sửa hình ảnh… trên menu Trang (xem hình trên). Phần bên trái của TRÌNH BIÊN TẬP HÌNH ẢNH chứa trang của tài liệu FineReader được chọn khi bạn mở Biên tập ảnh. Phần bên phải chứa nhiều tab với các công cụ để chỉnh sửa hình ảnh.

        - Chọn một công cụ và thực hiện các thay đổi mong muốn. Hầu hết các công cụ có thể được áp dụng cho các trang đã chọn hoặc cho tất cả các trang trong tài liệu. Bạn có thể chọn các trang sử dụng danh sách thả xuống Lựa chọn hoặc trong cửa sổ Trang.

        - Nhấp vào nút Thoát Trình biên tập hình ảnh sau khi bạn đã hoàn thành chỉnh sửa hình ảnh.

        Biên tập ảnh có chứa các công cụ sau:

        - Tiền xử lý được đề xuất Chương trình tự động xác định cần thực hiện điều chỉnh nào đối với hình ảnh. Các điều chỉnh có thể áp dụng bao gồm khử nhiễu và xóa mờ, đảo ngược màu để làm cho màu nền sáng, sửa nghiêng, nắn thẳng các dòng văn bản, sửa biến dạng hình thang và cắt đường viền hình ảnh.

        - Xử lý ảnh nghiêng Sửa nghiêng hình ảnh.

        - Làm thẳng dòng văn bản Nắn thẳng mọi dòng văn bản bị cong trên hình ảnh.

        - Sửa ảnh Các công cụ trong nhóm này cho phép bạn nắn thẳng các dòng văn bản, khử nhiễu và xóa mờ và biến màu nền của tài liệu thành màu trắng.

        - Sửa biến dạng hình thang Sửa biến dạng hình thang và xóa bỏ các cạnh của hình ảnh không chứa dữ liệu hữu ích nào. Khi công cụ này được chọn, một lưới màu xanh xuất hiện trên hình ảnh. Kéo các góc của lưới đến các góc của hình ảnh. Nếu bạn làm đúng thao tác này, các đường nằm ngang của lưới sẽ song song với các dòng văn bản. Bây giờ, nhấp vào nút Sửa.

        - Xoay và lật Các công cụ trong nhóm này cho phép bạn xoay hình ảnh và lật chúng theo chiều dọc hoặc ngang để văn bản trên hình ảnh hướng theo góc vuông.

        - Tách Các công cụ trong nhóm này cho phép bạn tách hình ảnh thành các phần. Điều này có thể hữu ích nếu bạn đang quét một cuốn sách và cần tách các trang đối diện.

        - Xén Xóa bỏ các cạnh của hình ảnh không chứa dữ liệu hữu ích.

        - Đảo ngược Đảo ngược màu hình ảnh. Điều này có thể hữu ích nếu bạn đang xử lý màu sắc văn bản phi tiêu chuẩn (văn bản sáng màu trên nền tối).

        - Độ phân giải Thay đổi độ phân giải hình ảnh.

        - Độ sáng và độ tương phản Thay đổi độ sáng và độ tương phản của hình ảnh.

        - Cấp Công cụ này cho phép bạn điều chỉnh các mức màu sắc của hình ảnh bằng cách thay đổi cường độ của điểm tối, điểm sáng và bán sắc.
Để tăng độ tương phản của hình ảnh, di chuyển thanh trượt trái và phải trên biểu đồ Cấp đầu vào. Thanh trượt trái thiết lập màu sẽ được coi là phần tối nhất của hình ảnh và thanh trượt phải thiết lập màu sẽ được coi là phần sáng nhất của hình ảnh. Di chuyển thanh trượt ở giữa sang phải sẽ làm tối hình ảnh và di chuyển sang trái sẽ làm sáng hình ảnh.
Điều chỉnh thanh trượt mức đầu ra để giảm độ tương phản của hình ảnh.

        - Tẩy Xóa bỏ một phần hình ảnh.

        - Xóa dấu màu Xóa bất kỳ nhãn màu hoặc dấu màu nào được thực hiện bằng bút để hỗ trợ nhận dạng văn bản bị che bởi các dấu này. Công cụ này được thiết kế cho các tài liệu được quét có văn bản tối trên nền trắng. Không sử dụng công cụ này cho ảnh và tài liệu kỹ thuật số có nền màu.

        7/ Thêm ảnh mà không xử lý

        Bạn có thể sử dụng các tác vụ tự động hóa Quét nhanh, Mở nhanh hoặc Quét và lưu dưới dạng hình ảnh trong cửa sổ Tác vụ để quét hoặc mở hình ảnh trong ABBYY FineReader mà không xử lý sơ bộ hoặc OCR. Điều này có thể hữu ích nếu bạn có tài liệu rất lớn và chỉ cần nhận dạng một số trang của tài liệu.

         Để biết chi tiết, xem "Sao chép nội dung từ tài liệu" và "Lưu hình ảnh của trang".

        - Trong danh sách thả xuống Chế độ màu, chọn chế độ màu đầy đủ hoặc đen trắng. Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu.

        - Nhấp vào tác vụ tự động hóa mà bạn cần:
 
           + Quét nhanh quét tài liệu giấy và mở hình ảnh trong ABBYY FineReader mà không xử lý sơ bộ ảnh hoặc OCR

           + Mở nhanh, mở tài liệu PDF và tệp hình ảnh trong ABBYY FineReader mà không xử lý sơ bộ ảnh hoặc OCR

           + Quét và lưu dưới dạng hình ảnh quét tài liệu và lưu ảnh quét. Sau khi hoàn thành quét, hộp thoại lưu hình ảnh sẽ mở ra.

        Để biết danh sách các định dạng tệp mà bạn có thể lưu hình ảnh được quét, xem "Các định dạng hình ảnh được hỗ trợ".

        Kết quả, hình ảnh sẽ được thêm vào tài liệu ABBYY FineReader mới hoặc được lưu vào thư mục mà bạn chọn.
« Sửa lần cuối: 26 Tháng Ba, 2017, 11:09:12 PM gửi bởi Giangtvx » Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #13 vào lúc: 26 Tháng Ba, 2017, 11:14:14 PM »

        
       VI - NHẬN DẠNG TÀI LIỆU

        ABBYY FineReader sử dụng công nghệ Nhận dạng ký tự quang học để chuyển đổi hình ảnh tài liệu thành văn bản có thể chỉnh sửa. Trước khi thực hiện OCR, chương trình phân tích cấu trúc của toàn bộ tài liệu và phát hiện các vùng chứa văn bản, mã vạch, hình ảnh và bảng. Chất lượng OCR có thể được cải thiện bằng cách chọn đúng ngôn ngữ tài liệu, chế độ đọc và kiểu in trước khi nhận dạng.

        Theo mặc định, tài liệu ABBYY FineReader được nhận dạng tự động. Cài đặt chương trình hiện hành được sử dụng cho nhận dạng tự động.

        Gợi ý: Bạn có thể tắt phân tích và OCR tự động cho các hình ảnh mới được thêm trong Quét/Mở của hộp thoại Tùy chọn (Công cụ>Tùy chọn…).

        Trong một số trường hợp, quá trình OCR có thể được bắt đầu thủ công. Ví dụ, nếu bạn đã tắt nhận dạng tự động, chọn thủ công các vùng trên hình ảnh, hoặc thay đổi các cài đặt sau đây trong hộp thoại Tùy chọn (Công cụ > Tùy chọn…):

        - Ngôn ngữ nhận dạng trên tab Tài liệu

        - Loại tài liệu trên tab Tài liệu

        - Chế độ màu trên tab Tài liệu

        - Các tùy chọn nhận dạng trên tab Đọc

        - Phông chữ được sử dụng trên tab Đọc

        Để khởi chạy thủ công quá trình OCR:

        - Nhấp vào nút Đọc trên thanh công cụ chính, hoặc

        -  Nhấp vào Đọc tài liệu trên menu Tài liệu

        Gợi ý: Để nhận dạng vùng hoặc trang đã chọn, sử dụng các tùy chọn thích hợp trên menu Trang và Vùng hoặc sử dụng menu chuột phải.

        1/ Tài liệu FineReader là gì?

        Khi làm việc với chương trình, bạn có thể lưu kết quả tạm thời trong tài liệu FineReader để bạn có thể tiếp tục công việc của mình ở nơi bạn dừng lại. Tài liệu FineReader chứa hình ảnh nguồn, văn bản đã được nhận dạng trong hình ảnh, các cài đặt chương trình của bạn và bất kỳ mẫu người dùng, ngôn ngữ hoặc nhóm ngôn ngữ nào mà bạn đã tạo để nhận dạng văn bản trong hình ảnh.

         a. Mở tài liệu FineReader: Khi bạn khởi động ABBYY FineReader, một tài liệu FineReader mới được tạo. Bạn có thể sử dụng tài liệu này hoặc mở tài liệu hiện có.

        Để mở tài liệu FineReader hiện có:

        - Trên menu Tệp, nhấp vào Mở tài liệu FineReader…

        - Chọn tài liệu mong muốn trong hộp thoại mở ra.

        Lưu ý: Khi bạn mở tài liệu FineReader được tạo trong phiên bản trước của chương trình, ABBYY FineReader sẽ cố gắng chuyển đổi tài liệu về phiên bản hiện tại của định dạng tài liệu FineReader. Quá trình này không thể đảo ngược và bạn sẽ được nhắc lưu tài liệu đã chuyển đổi trong tên khác. Văn bản được nhận dạng từ tài liệu cũ sẽ không được chuyển sang tài liệu mới.

        Gợi ý: Nếu bạn muốn mở tài liệu bạn đã làm việc lần trước khi bạn khởi động ABBYY FineReader, chọn tùy chọn Mở tài liệu FineReader được sử dụng mới nhất khi chương trình khởi động trên tab Nâng cao của hộp thoại Tùy chọn (nhấp vào Công cụ > Tùy chọn… để mở hộp thoại).

        Bạn cũng có thể mở tài liệu FineReader từ Windows Explorer bằng cách nhấp chuột phải vào tài liệu rồi nhấp Mở bằng ABBYY FineReader 12. Tài liệu FineReader có biểu tượng  

        b. Thêm hình ảnh vào tài liệu FineReader

        - Trên menu Tệp, nhấp Mở tệp PDF hoặc hình ảnh…

        - Chọn một hoặc nhiều tệp hình ảnh trong hộp thoại mở ra và nhấp vào Mở. Hình ảnh sẽ được thêm vào cuối tài liệu FineReader đang mở và bản sao của hình ảnh sẽ được lưu trong thư mục của tài liệu.

        Bạn cũng có thể thêm hình ảnh từ Windows Explorer vào tài liệu FineReader. Nhấp chuột phải vào hình ảnh trong Windows Explorer rồi nhấp vào Mở bằng ABBYY FineReader trên menu chuột phải. Nếu tài liệu FineReader đã mở khi bạn làm như vậy, hình ảnh sẽ được thêm vào cuối tài liệu này. Nếu bạn không gặp trường hợp này, một tài liệu FineReader mới sẽ được tạo từ hình ảnh.

        Ảnh quét cũng có thể được thêm vào. Để biết chi tiết, xem "Quét tài liệu giấy".
Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #14 vào lúc: 28 Tháng Ba, 2017, 06:42:38 PM »

       
        c. Xóa một trang khỏi tài liệu

        - Chọn một trang trong cửa sổ Trang rồi bấm phím Xóa hoặc

        - Trên menu Trang, nhấp vào Xóa trang khỏi tài liệu hoặc

        - Nhấp chuột phải vào trang đã chọn và nhấp Xóa trang khỏi tài liệu. Bạn có thể chọn và xóa nhiều trang trong cửa sổ Trang.

        d. Lưu tài liệu

        - Trên menu Tệp, nhấp Lưu tài liệu FineReader…

        - Chỉ định đường dẫn đến thư mục mà bạn muốn lưu tài liệu và tên của tài liệu trong hộp thoại mở ra.

        Quan trọng! Khi bạn lưu tài liệu ABBYY FineReader, mọi mẫu người dùng và ngôn ngữ đã được tạo khi bạn làm việc với tài liệu này được lưu cùng với hình ảnh trang và văn bản.

        e. Đóng tài liệu

        - Để đóng một trang tài liệu, nhấp vào Đóng trang hiện tại trên menu Tài liệu.

        - Để đóng toàn bộ tài liệu, nhấp Đóng tài liệu FineReader từ menu Tệp.

        f. Tách tài liệu FineReader: Khi xử lý số lượng lớn các tài liệu nhiều trang, thông thường sẽ thực tế hơn khi quét tất cả tài liệu trước rồi sau đó mới phân tích và nhận dạng chúng. Tuy nhiên, để giữ nguyên định dạng gốc của từng tài liệu giấy một cách chính xác, ABBYY FineReader phải xử lý từng tài liệu dưới dạng một tài liệu FineReader riêng. ABBYY FineReader bao gồm các công cụ để nhóm các trang được quét thành các tài liệu riêng biệt.

        Để tách một tài liệu ABBYY FineReader thành một vài tài liệu:

        - Trên menu Tệp, nhấp vào Tách Tài liệu FineReader… hoặc chọn các trang trong ngăn Trang, nhấp chuột phải vào lựa chọn rồi nhấp vào Di chuyển các trang sang tài liệu mới…

        - Trong hộp thoại mở ra, tạo số lượng tài liệu cần thiết bằng cách nhấp vào nút Thêm tài liệu.

        - Di chuyển các trang từ cửa sổ Trang vào các tài liệu thích hợp của chúng được hiển thị trong ngăn Tài liệu mới sử dụng một trong ba phương thức sau:

           + Chọn trang và dùng chuột để kéo trang; Lưu ý: Bạn cũng có thể sử dụng kéo và thả để di chuyển trang giữa các tài liệu.

           + Nhấp vào nút Di chuyển để di chuyển các trang đã chọn vào tài liệu hiện tại được hiển thị trong ngăn Tài liệu mới hoặc nhấp vào nút Trả lại để đưa các trang quay lại cửa sổ Trang.

           + Sử dụng phím tắt: bấm Ctrl+Mũi tên phải để di chuyển các trang đã chọn từ cửa sổ Trang đến tài liệu đã chọn trong ngăn Tài liệu mới và Ctrl+Mũi tên trái hoặc Delete để đưa chúng quay lại.

        - Khi bạn đã hoàn thành việc di chuyển trang vào tài liệu FineReader mới, nhấp vào nút Tạo tất cả để tạo đồng thời tất cả tài liệu hoặc nhấp vào nút Tạo trong từng tài liệu riêng biệt.
        Gợi ý: Bạn cũng có thể kéo và thả các trang đã chọn từ ngăn Trang vào bất kỳ cửa sổ ABBYY FineReader nào khác. Một tài liệu ABBYY FineReader mới sẽ được tạo cho các trang này.

        g. Sắp xếp thứ tự các trang trong tài liệu FineReader

        - Chọn một hoặc nhiều trang trong cửa sổ Trang.

        - Nhấp chuột phải vào lựa chọn rồi nhấp vào Xếp lại thứ tự trang… trên menu chuột phải.
 
       - Trong hộp thoại Xếp lại thứ tự trang, chọn một trong các tùy chọn sau:

           + Xếp lại thứ tự trang (không thể hoàn tác): Thao tác này sẽ thay đổi tất cả số trang một cách lần lượt, bắt đầu với trang được chọn.

           + Khôi phục thứ tự trang gốc sau khi quét hai mặt: Tùy chọn này khôi phục đánh số trang ban đầu của tài liệu có các trang hai mặt nếu bạn sử dụng máy quét có khay nạp giấy tự động để quét tất cả các trang đánh số lẻ trước rồi đến tất cả các trang đánh số chẵn. Bạn có thể chọn thứ tự bình thường và đảo ngược cho các trang đánh số chẵn.

        Quan trọng! Tùy chọn này sẽ chỉ hoạt động nếu từ 3 trang được đánh số liên tiếp trở lên được chọn.

           + Đổi trang sách: Tùy chọn này hữu ích nếu bạn quét một cuốn sách viết bằng chữ viết từ trái sang phải và tách các trang đối diện nhưng không chỉ định được ngôn ngữ chính xác.

        Quan trọng! Tùy chọn này sẽ chỉ hoạt động cho từ 2 trang được đánh số liên tiếp trở lên, bao gồm ít nhất 2 trang đối diện. Ghi chú: Để hủy thao tác này, chọn Hoàn tác thao tác cuối.

         Nhấp vào OK.

         Thứ tự của các trang trong cửa sổ Trang sẽ thay đổi để thể hiện cách đánh số mới.

         Lưu ý:

           + Để thay đổi số của một trang, nhấp vào số của trang này trong cửa sổ Trang và nhập số mới vào trường.

           + Ở chế độ Hình thu nhỏ, bạn có thể thay đổi cách đánh số trang chỉ bằng cách kéo các trang đã chọn tới vị trí mong muốn trong tài liệu.
Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #15 vào lúc: 31 Tháng Ba, 2017, 11:05:28 AM »

         
        h. Thuộc tính tài liệu

        Thuộc tính tài liệu chứa thông tin về tài liệu (tiêu đề mở rộng của tài liệu, tác giả, chủ đề, từ khóa, v.v..). Thuộc tính tài liệu có thể được sử dụng để sắp xếp tệp của bạn. Ngoài ra, bạn có thể tìm kiếm tài liệu theo thuộc tính của chúng và chỉnh sửa thuộc tính của tài liệu.

        Khi nhận dạng tài liệu PDF và các loại tệp hình ảnh nhất định, ABBYY FineReader sẽ kết xuất thuộc tính của tài liệu nguồn. Sau đó, bạn có thể chỉnh sửa các thuộc tính này.

        Để thêm hoặc sửa đổi thuộc tính tài liệu:

        - Nhấp vào Công cụ > Tùy chọn…

        - Nhấp vào tab Tài liệu và trong nhóm Thuộc tính tài liệu, chỉ định tiêu đề, tác giả, chủ đề và từ khóa.

        i. Mẫu và ngôn ngữ

        Bạn có thể lưu cài đặt mẫu và ngôn ngữ và tải cài đặt từ tệp.

         Để biết thêm về mẫu, xem "Nếu tài liệu in của bạn chứa phông chữ phi tiêu chuẩn". Phần "Nếu chương trình không nhận dạng được một số ký tự" giải thích cách sử dụng ngôn ngữ người dùng.

        Để lưu mẫu và ngôn ngữ vào một tệp:

        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.

        - Trong Mẫu người dùng và ngôn ngữ, nhấp vào nút Lưu vào tệp….

        - Trong hộp thoại mở ra, nhập tên cho tệp của bạn và chỉ định nơi lưu trữ. Tệp này sẽ chứa đường dẫn tới thư mục lưu trữ ngôn ngữ người dùng, nhóm ngôn ngữ, từ điển và mẫu.

        Để tải mẫu và ngôn ngữ:

        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…) rồi nhấp vào tab Đọc.

        - Trong Mẫu người dùng và ngôn ngữ, nhấp vào nút Tải từ tệp….

        - Trong hộp thoại Tùy chọn tải, chọn tệp có chứa ngôn ngữ và mẫu người dùng mong muốn (tệp phải có phần mở rộng là *.fbt) và nhấp vào Mở.
Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #16 vào lúc: 01 Tháng Tư, 2017, 07:59:31 PM »

      
       2/ Các tính năng của tài liệu cần xem xét trước khi OCR

        a. Ngôn ngữ tài liệu

        ABBYY FineReader nhận dạng cả tài liệu đơn ngữ và đa ngữ (nghĩa là được viết bằng hai hoặc nhiều ngôn ngữ). Đối với tài liệu đa ngữ, bạn cần chọn một số ngôn ngữ nhận dạng.

        Để chỉ định ngôn ngữ OCR cho tài liệu của bạn, trong danh sách thả xuống Ngôn ngữ tài liệu trên thanh công cụ chính hoặc trong cửa sổ Tác vụ, chọn một trong các tùy chọn sau:

­        - Tự động chọn: ABBYY FineReader sẽ tự động chọn ngôn ngữ phù hợp từ danh sách ngôn ngữ do người dùng xác định. Để sửa đổi danh sách này:

       + Chọn Ngôn ngữ khác…

           * Trong hộp thoại Trình biên tập ngôn ngữ, chọn tùy chọn Tự động chọn ngôn ngữ cho tài liệu từ danh sách sau.

           * Nhấp vào nút Chỉ định….

           * Trong hộp thoại Ngôn ngữ, chọn các ngôn ngữ mong muốn.

­       + Một ngôn ngữ hoặc kết hợp các ngôn ngữ: Chọn một ngôn ngữ hoặc kết hợp các ngôn ngữ. Danh sách ngôn ngữ bao gồm các ngôn ngữ nhận dạng được sử dụng gần đây, cũng như Tiếng Anh, Tiếng Đức và Tiếng Pháp.

­        + Ngôn ngữ khác…: Chọn tùy chọn này nếu ngôn ngữ bạn cần không hiển thị trong danh sách. Trong hộp thoại Trình biên tập ngôn ngữ, chọn tùy chọn Chỉ định ngôn ngữ thủ công rồi chọn ngôn ngữ hoặc các ngôn ngữ mong muốn bằng cách chọn các ô thích hợp. Nếu bạn thường sử dụng kết hợp ngôn ngữ cụ thể, bạn có thể tạo một nhóm mới cho những ngôn ngữ này.

        Nếu một ngôn ngữ không có trong danh sách, hoặc là:

           * Ngôn ngữ này không được hỗ trợ bởi ABBYY FineReader. Để biết danh sách đầy đủ các ngôn ngữ được hỗ trợ, xem "Ngôn ngữ được hỗ trợ".

           * Ngôn ngữ này không được hỗ trợ bởi bản sao phần mềm của bạn. Danh sách đầy đủ các ngôn ngữ hiện có trong bản sao của bạn có thể tìm thấy trong hộp thoại Giấy phép (Trợ giúp > Giới thiệu… > Thông tin giấy phép).

        Ngoài việc sử dụng các ngôn ngữ và nhóm ngôn ngữ tích hợp, bạn có thể tạo ngôn ngữ của riêng mình. Để biết chi tiết, xem "Nếu chương trình không nhận dạng được một số ký tự".

        b. Kiểu in

        Tài liệu có thể được in trên nhiều thiết bị khác nhau như máy đánh chữ và máy fax. Chất lượng OCR có thể được cải thiện bằng cách chọn đúng Loại tài liệu trong hộp thoại Tùy chọn.

        Đối với hầu hết các tài liệu, chương trình sẽ phát hiện kiểu in tự động. Để phát hiện kiểu in tự động, tùy chọn Tự động phải được chọn trong Loại tài liệu trong hộp thoại Tùy chọn (Công cụ > Tùy chọn…). Bạn có thể xử lý tài liệu ở chế độ màu đầy đủ hoặc đen trắng.

        Bạn cũng có thể chọn để lựa chọn kiểu in theo cách thủ công nếu cần.


        a: Ví dụ về văn bản được đánh máy. Tất cả nét chữ có chiều rộng bằng nhau (so sánh, ví dụ: "w" và "t"). Đối với văn bản thuộc loại này, chọn Máy đánh chữ.

        b: Ví dụ về văn bản được tạo ra bởi máy fax. Như bạn có thể thấy từ ví dụ, các nét chữ không rõ ràng trong một số vị trí, ngoài hiện tượng nhiễu và biến dạng. Đối với văn bản thuộc loại này, chọn Fax.

        Gợi ý: Sau khi nhận dạng văn bản được đánh máy hoặc fax, đảm bảo chọn Tự động trước khi xử lý các tài liệu in thông thường.

Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #17 vào lúc: 03 Tháng Tư, 2017, 07:38:05 AM »


        c. Chất lượng in

        Tài liệu có chất lượng kém bị "nhiễu" (nghĩa là có chấm hoặc vệt màu đen ngẫu nhiên), nét chữ không đều và bị mờ hoặc các dòng bị nghiêng và đường viền bảng bị dịch chuyển có thể yêu cầu cài đặt quét cụ thể.


        Tài liệu có chất lượng kém được quét tốt nhất ở thang độ xám. Khi quét ở thang độ xám, chương trình sẽ tự động chọn giá trị độ sáng tối ưu.

        Chế độ quét thang độ xám giữ lại nhiều thông tin hơn về nét chữ trong văn bản được quét để có được kết quả OCR tốt hơn khi nhận dạng tài liệu có chất lượng từ trung bình đến kém. Bạn cũng có thể sửa một số lỗi bằng cách thủ công sử dụng công cụ chỉnh sửa hình ảnh có trong Biên tập ảnh. Để biết chi tiết, xem "Xử lý sơ bộ ảnh".

        d. Chế độ màu

        Nếu bạn không cần giữ màu gốc của tài liệu màu đầy đủ, bạn có thể xử lý tài liệu ở chế độ đen trắng. Điều này sẽ giảm đáng kể kích cỡ tài liệu ABBYY FineReader thu được và tăng tốc quy trình OCR. Tuy nhiên, xử lý hình ảnh có độ tương phản thấp ở chế độ đen trắng có thể dẫn đến chất lượng OCR kém. Chúng tôi cũng không đề xuất xử lý ở chế độ đen trắng cho ảnh, trang tạp chí và văn bản bằng Tiếng Trung, Tiếng Nhật và Tiếng Hàn.

        Lưu ý: Bạn cũng có thể tăng tốc độ nhận dạng tài liệu màu và đen trắng bằng cách chọn tùy chọn Đọc nhanh trên tab Đọc của hộp thoại Tùy chọn. Để biết thêm thông tin về các chế độ nhận dạng, xem Tùy chọn OCR.

        Để chọn chế độ màu:

        - Sử dụng danh sách thả xuống Chế độ màu trong hộp thoại Tác vụ hoặc

        - Chọn một trong các tùy chọn trong Chế độ màu trên tab Tài liệu của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

        Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu. Để có tài liệu màu, mở tệp với hình ảnh màu hoặc quét tài liệu giấy ở chế độ màu.
Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #18 vào lúc: 04 Tháng Tư, 2017, 09:15:52 AM »


        3/ Tùy chọn OCR

        a. Chế độ đọc

        Có hai chế độ đọc trong ABBYY FineReader 12:

        - Đọc kỹ: Trong chế độ này, ABBYY FineReader phân tích và nhận dạng cả tài liệu đơn giản và tài liệu có bố cục phức tạp, thậm chí cả tài liệu có văn bản in trên nền màu hoặc đường quét và tài liệu có bảng phức hợp (bao gồm bảng có đường lưới màu trắng và bảng có ô màu).


        Lưu ý: So với chế độ Nhanh, chế độ Kỹ tốn nhiều thời gian hơn nhưng đảm bảo chất lượng nhận dạng tốt hơn.

        - Đọc nhanh: Chế độ này được đề xuất để xử lý tài liệu lớn có bố cục đơn giản và hình ảnh chất lượng tốt.

        b. Phát hiện thành phần cấu trúc

        Chọn các thành phần cấu trúc mà bạn muốn chương trình phát hiện: đầu trang và chân trang, chú thích cuối trang, mục lục và danh sách. Những thành phần đã chọn sẽ tương tác khi tài liệu được lưu.

        c. Lập mẫu

        Nhận dạng và lập mẫu được sử dụng để nhận dạng các loại văn bản sau:

        - Văn bản có các thành phần trang trí

        - Văn bản có các ký hiệu đặc biệt (ví dụ: ký hiệu toán học ít gặp)

        - Khối lượng lớn văn bản từ hình ảnh chất lượng kém (trên 100 trang)

        Tùy chọn Đọc và huấn luyện bị tắt theo mặc định. Bật tùy chọn này để lập mẫu cho ABBYY FineReader khi nhận dạng văn bản.

        Bạn có thể sử dụng các mẫu tích hợp hoặc tùy chỉnh để nhận dạng. Chọn một trong các tùy chọn trong Huấn luyện để chọn mẫu nào bạn muốn sử dụng.

        d. Ngôn ngữ và mẫu người dùng

        Bạn có thể lưu và tải cài đặt mẫu người dùng và ngôn ngữ. Để biết chi tiết, xem "Tài liệu FineReader là gì?"

        e. Phông chữ

        Tại đây bạn có thể chọn phông chữ sẽ được sử dụng khi lưu văn bản được nhận dạng.
        Để chọn phông chữ:

        - Nhấp vào nút Phông chữ….

        - Chọn phông chữ mong muốn và nhấp vào OK.

        f. Mã vạch

        Nếu tài liệu của bạn chứa mã vạch và bạn muốn chuyển đổi chúng sang chuỗi chữ cái và chữ số thay vì lưu dưới dạng ảnh, chọn Tìm kiếm mã vạch. Tính năng này bị tắt theo mặc định.
Logged

Giangtvx
Thượng tá
*
Bài viết: 13601


« Trả lời #19 vào lúc: 04 Tháng Tư, 2017, 09:36:57 PM »

           
       4/ Làm việc với ngôn ngữ chữ viết phức tạp

       a. Cài đặt hỗ trợ ngôn ngữ

        Để có thể nhận dạng văn bản viết bằng Tiếng Ả Rập, Tiếng Do Thái, Tiếng Yiddish, Tiếng Thái, Tiếng Trung, Tiếng Nhật và Tiếng Hàn, bạn có thể cần cài đặt những ngôn ngữ này.

        Microsoft Windows 8, Windows 7 và Windows Vista hỗ trợ những ngôn ngữ này theo mặc định.

        Để cài đặt ngôn ngữ mới trong Microsoft Windows XP:

­        - Nhấp vào Bắt đầu trên thanh tác vụ.

­        - Nhấp vào Bảng điều khiển > Tùy chọn khu vực và ngôn ngữ.

­        - Nhấp vào tab Ngôn ngữ và chọn các tùy chọn sau:

           + Cài đặt các đặt tệp cho ngôn ngữ chữ viết phức tạp và ngôn ngữ từ phải sang trái (bao gồm Tiếng Thái): để bật hỗ trợ cho Tiếng Ả Rập, Tiếng Do Thái, Tiếng Yiddish và Tiếng Thái

           + Cài đặt tệp cho ngôn ngữ Đông Á: để bật hỗ trợ cho Tiếng Nhật, Tiếng Trung và Tiếng Hàn

­           + Nhấp vào OK.

        b. Phông chữ khuyến nghị

        Nhận dạng văn bản bằng tiếng Tiếng Ả Rập, Tiếng Do Thái, Tiếng Yiddish, Tiếng Thái, Tiếng Trung, Tiếng Nhật và Tiếng Hàn có thể cần cài đặt các phông chữ bổ sung trong Windows. Bảng dưới đây liệt kê các phông chữ khuyến nghị cho văn bản bằng những ngôn ngữ này.


        * Phông chữ này được cài đặt cùng với Microsoft Windows XP và Microsoft Office 2000 hoặc mới hơn.

        Các phần dưới đây có lời khuyên về cách cải thiện độ chính xác nhận dạng.

        c. Tắt xử lý tự động

        Theo mặc định, bất kỳ trang nào bạn thêm vào Tài liệu ABBYY FineReader đều được nhận dạng tự động. Tuy nhiên, nếu tài liệu của bạn chứa văn bản ở ngôn ngữ CJK kết hợp với một ngôn ngữ châu Âu, chúng tôi đề xuất bạn tắt phát hiện hướng trang tự động và chỉ sử dụng tùy chọn tách trang kép nếu tất cả các hình ảnh trang đều đúng hướng (ví dụ: chúng không được quét từ dưới lên).

        Có thể bật và tắt tùy chọn Phát hiện hướng trang và Tách các trang đối diện trên tab Quét/Mở của hộp thoại Tùy chọn.

        Lưu ý: Để tách các trang đối diện bằng Tiếng Ả Rập, Tiếng Do Thái hoặc Tiếng Yiddish, đảm bảo trước hết chọn ngôn ngữ nhận dạng tương ứng và sau đó mới chọn tùy chọn Tách các trang đối diện. Việc này sẽ đảm bảo rằng các trang được sắp xếp đúng thứ tự. Bạn cũng có thể khôi phục cách đánh số trang gốc bằng cách chọn tùy chọn Đổi trang sách. Để biết chi tiết, xem "Tài liệu FineReader là gì?"

        Nếu tài liệu của bạn có cấu trúc phức tạp, chúng tôi khuyến nghị tắt phân tích và OCR tự động đối với hình ảnh và thực hiện thủ công các thao tác này.

        Để tắt phân tích và OCR tự động:

­        - Mở hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

­­        - Bỏ chọn tùy chọn Tự động xử lý các trang khi chúng được thêm vào trên tab Quét/Mở.

­­        - Nhấp vào OK.
Logged

Trang: « 1 2 3 4 5 6 7 »   Lên
  In  
 
Chuyển tới:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.19 | SMF © 2006-2008, Simple Machines

Valid XHTML 1.0! Valid CSS! Dilber MC Theme by HarzeM