Cổng vào tri thức => Tin học => Topic started by: hangle124 on 19/02/08, 16:25 Return to Full Version

Title: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 19/02/08, 16:25
Tớ đang dùng máy scanner HP 5590, sau khi scan thảnh file dạng ảnh, muốn convert sang file văn bản. Nhưng Tiếng Anh và một số ngoại ngữ khác thì ổn, còn Tiếng Việt thì thua. Giúp tớ với
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: symphony on 19/02/08, 16:55
Dùng thử phần mềm VNDOC của Viện Công nghệ Thông tin - Viện Khoa học Công nghệ Việt Nam xem!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 19/02/08, 17:17
Tool này có lẽ là tool để nhận dạng văn bản tiếng Việt, chữ viết tắt thường dùng là OCR. Giải pháp nhận dạng tiếng Việt tốt nhất mà em được biết là VNDOC, tuy nhiên, tool này chỉ chính xác được 85%. Và nếu chị scan thì nghĩa là chị phải sửa, việc sửa này làm còn nhức đầu hơn là chị type nó vào máy tính từ bàn phím.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: Sao_Online on 19/02/08, 18:07
Quote from: symphony on 19/02/08, 16:55
Dùng thử phần mềm VNDOC của Viện Công nghệ Thông tin - Viện Khoa học Công nghệ Việt Nam xem!

Ai Crack được OCR VDOC Pro 3.0 tôi up lên cho.

Tôi có 7 bộ đĩa bản quyền, nhưng Key đăng ký của nó rất phức tạp. Sau khi cài đặt phải ghi lại Mã của máy tính gửi cho nhà sản xuất để nhận được Key theo Mã máy. Sự phức tạp này làm tôi quá đau đầu vì lỡ phải cài lại máy mà không thể đăng ký lại nổi!

Hướng khắc phục thế nào? Gỡ luôn cho tôi cái!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 19/02/08, 21:09
Nếu như ko nhầm thì key của VNDOC dựa trên mã của ổ cứng của máy, thử báo với họ là máy của tôi hỏng ổ cứng rồi, tôi muốn xin key khác thì thế nào.

Mày cứ up lên xem thế nào, hình như đĩa phải dùng tool CD clone mới được, ko copy được theo cách thông thường.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: Sao_Online on 19/02/08, 22:22
Quote from: saos@ngmo on 19/02/08, 21:09
Nếu như ko nhầm thì key của VNDOC dựa trên mã của ổ cứng của máy, thử báo với họ là máy của tôi hỏng ổ cứng rồi, tôi muốn xin key khác thì thế nào.

Mày cứ up lên xem thế nào, hình như đĩa phải dùng tool CD clone mới được, ko copy được theo cách thông thường.

Nói như ông thì nói làm quái gì. Đợi nó reques mất hàng tuần, hàng tháng trời. Mình muốn làm chủ cái phần mềm của nó cơ!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 19/02/08, 22:33
1. Nếu như ko nhầm thì key của VNDOC dựa trên mã của ổ cứng của máy, thử báo với họ là máy của tôi hỏng ổ cứng rồi, tôi muốn xin key khác thì thế nào.

2. Mày cứ up lên xem thế nào, hình như đĩa phải dùng tool CD clone mới được, ko copy được theo cách thông thường.

Đấy là 2 vế hoàn toàn khác nhau của 1 bài viết.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 20/02/08, 07:44
Cám ơn mọi người. Mình sẽ xem xét các giải pháp mọi người đưa ra.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: Sao_Online on 20/02/08, 10:09
Mọi việc tưởng như đơn giản nhưng hoàn toàn ngược lại. Thật khó khăn.

Không thể copy, zip hay burn disk... Tất cả các đĩa đều được bảo vệ bản quyền bằng cách làm lỗi một số sector đĩa. Đĩa nào cũng như đĩa nào.

Bộ đĩa bản quyền này do dự án cấp. Theo kinh phí dự án cung cấp thì giá thành của mỗi bộ đĩa là 8 triệu đồng. Ặc ặc...

Còn có cách nào khác để up lên không SSM?

(http://img.huongtinhyeu.net/files/97dy1i1y9ltnuzwev08x.jpg)

(http://img.huongtinhyeu.net/files/ahf1sbx5o9nd6f9vyutw.jpg)

(http://img.huongtinhyeu.net/files/6q8fr7upg8pied84397l.jpg)

Nó chính là "chấm trắng" trong vòng tròn đen!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: symphony on 20/02/08, 12:42
Down bản dùng thử đi, chạy cũng đc
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 20/02/08, 14:09
Quotehình như đĩa phải dùng tool CD clone mới được

Tìm phần mềm có tên là CloneCD hoặc tương tự để copy ra ổ cứng, hoặc ISO đĩa CD đó, giải pháp của họ chống sao chép mà, giờ mới biết điều này à? :)
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: Sao_Online on 20/02/08, 15:00
Quote from: saos@ngmo on 20/02/08, 14:09
Quotehình như đĩa phải dùng tool CD clone mới được

Tìm phần mềm có tên là CloneCD hoặc tương tự để copy ra ổ cứng, hoặc ISO đĩa CD đó, giải pháp của họ chống sao chép mà, giờ mới biết điều này à? :)

Mày vào mà làm, thích thì tối qua nhà cầm 1 đĩa về. Tao thử hết thuốc rồi!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 20/02/08, 15:38
Để khi dỗi tao qua, cách đây 2 năm tao cũng đã biết tới cái đĩa của bọn mày rồi, trong Nha Trang nên không tiện cầm về nhà để tweak. Theo dự đoán của tao công nghệ chống sao chép đó đã lỗi thời rồi, có vài tool của Nga ngố tao ko nhớ rõ nhưng làm được việc này, và việc clone được CD thì cũng chỉ là cho phép copy đi chứ chưa phải crack, crack mới thực sự là câu chuyện khó.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 20/02/08, 16:21
Chị Hangle124 nên trình bày yêu cầu của mình để có tư vấn tốt hơn. Ví dụ chị muốn nhận dạng văn bản tiếng Việt để soạn thảo nội dung đã scan hay là dùng để in cho người khác đọc, hay là để tiết kiệm không gian lưu trữ,.... hay là gì?
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: symphony on 21/02/08, 08:53
Quote from: saos@ngmo on 20/02/08, 15:38
Để khi dỗi tao qua.

Đấy, S_O cứ cãi nhau với SSM làm SSM dỗi rồi đây này!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 21/02/08, 10:47
Quote from: saos@ngmo on 20/02/08, 16:21
Chị Hangle124 nên trình bày yêu cầu của mình để có tư vấn tốt hơn. Ví dụ chị muốn nhận dạng văn bản tiếng Việt để soạn thảo nội dung đã scan hay là dùng để in cho người khác đọc, hay là để tiết kiệm không gian lưu trữ,.... hay là gì?

Chị cần nhận dạng văn bản TV để soạn thảo nội dung đã scan và tiết kiệm không gian lưu trữ. Yêu cầu cơ bản vẫn là soạn thảo lại VB đã scan.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 21/02/08, 10:51
Quote from: saos@ngmo on 20/02/08, 15:38
Để khi dỗi tao qua, cách đây 2 năm tao cũng đã biết tới cái đĩa của bọn mày rồi, trong Nha Trang nên không tiện cầm về nhà để tweak. Theo dự đoán của tao công nghệ chống sao chép đó đã lỗi thời rồi, có vài tool của Nga ngố tao ko nhớ rõ nhưng làm được việc này, và việc clone được CD thì cũng chỉ là cho phép copy đi chứ chưa phải crack, crack mới thực sự là câu chuyện khó.

Khi nào "rỗi rãi" thì SSM sang S-O nhé.  ::) Còn về chuyện crack, chị có đọc trên 1 diễn đàn IT, thấy có người bảo là đã dùng bản crack phần mềm VnDOCR, không biết thực hư thế nào vì người ta không up lên. Nói nhỏ với SSM: quan điểm dùng hàng "xịn" của chị bị lung lay rồi.  :( , bây giờ lại trông chờ để "đạo" đây. hic hic
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 25/02/08, 09:09
sry chị và bạn Tường vì lõi chính tả của em.

Chị thử download bản demo về dùng xem thế nào, đã có phiên bản 4.0 rồi, theo marketing của họ thì độ chính xác là 99%
http://www.vndocr.com/home/Products.asp?ProductID=2

Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 25/02/08, 16:48
Cám ơn SSM, chị đã tải về, cài đặt và thử sử dụng.
Nhưng rất tiếc là không được. Bản demo không cho xem phần hướng dẫn cách sử dụng phần mềm.
Tuy giao diện toàn bộ bằng tiếng Việt, nhưng khi chọn các lệnh để xử lý thì không thực hiện được. Chị đã thử nhiều cách. Không biết đã làm đúng hay chưa nữa nhưng không có kết quả. :bawling:  :bawling:  :bawling:
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: Sao_Online on 25/02/08, 17:46
Quote from: hangle124 on 25/02/08, 16:48
Cám ơn SSM, chị đã tải về, cài đặt và thử sử dụng.
Nhưng rất tiếc là không được. Bản demo không cho xem phần hướng dẫn cách sử dụng phần mềm.
Tuy giao diện toàn bộ bằng tiếng Việt, nhưng khi chọn các lệnh để xử lý thì không thực hiện được. Chị đã thử nhiều cách. Không biết đã làm đúng hay chưa nữa nhưng không có kết quả. :bawling:  :bawling:  :bawling:

Quá dễ. Không biết hỏi ai để biết cách sử dụng sao? Tưởng đã biết người chuyên sử dụng phần mềm này rồi cơ mà? Lấy giấy bút ra đi!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: Sao_Online on 25/02/08, 20:39
VNDOCR chỉ cho phép xử lý ảnh 1 bit màu (đen trắng) vì vậy tất cả các ảnh màu (từ 8 bit trở lên, nếu đã quét) đều phải chuyển về dạng đen trắng.
Coi như chưa quét gì cả. Bắt đầu làm từ đầu nhé.

Chọn máy quét: Tệp -> Quét ảnh -> Chọn máy quét.
Thực hiện quét: Tệp -> Quét ảnh -> Thực hiện.
(Chọn quét thành ảnh đen trắng) -> Coi như đã quét xong.

(http://img.huongtinhyeu.net/files/cresyezh5rt7wnksqut9.jpg)

Xử lý, chuyển ảnh sang text:
Chọn Đọc ảnh -> Mở ảnh (nhiều ảnh (file)) theo thứ tự trang cần chuyển sang text.

(http://img.huongtinhyeu.net/files/krfpprcyjqbok95k1vq6.jpg)

Nếu chữ trong ảnh kém chất lượng (hoặc mờ) -> Bấm chuột phải vào trang cần điều chỉnh (khung bên trái) -> Chọn công cụ ảnh -> Xóa nhiễu (tăng chất lượng ảnh)... Coi như xử lý ảnh đã xong -> Chọn Xử lý -> Đánh dấu vùng bằng tay -> Tạo mới (có phím tắt ở thanh công cụ).  Chọn phân vùng bằng tay, không nên chọn tự động, mục đích nhằm chọn tất cả text trong ảnh chỉ nằm trong 1 vùng (chỉ làm nhiều vùng khi text chia theo cột).

Đưa chuột về chọn toàn bộ vùng chữ trên ảnh (như vẽ hình trong Word, nếu chọn chưa chuẩn có thể xóa và chọn lại).

Chọn xong rồi thì -> Nhận dạng. Bên khung phải, text sẽ xuất hiện -> Tệp -> Lưu văn bản (Lưu văn bản với tên).

Lưu ý: Chỉ nhận dạng và dịch text được từng trang một. Nhận dạng trang sau phải chọn Tệp -> Lưu văn bản với tên kẻo bị ghi đè vào trang trước vừa lưu.

Sau đó mở văn bản đã lưu rồi dồn lại, chỉnh sửa... Thế là xong.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 26/02/08, 08:10
Cám ơn em Nát đã chỉ giáo, nhưng tiếc là cũng không thực hiện được vì nó không chịu quét ảnh, mà chị không biết cách để chuyển ảnh màu thành đen trắng  :bawling:
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: symphony on 26/02/08, 08:37
Hế hế, thế này thì cần phải tập huấn dài dài. Đề nghị chị ra Hà Nội thôi!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 26/02/08, 10:17
Có thể phần mềm này không tích hợp được với máy quét chị đang sử dụng hoặc giả chị chưa biết cách, trong trường hợp đó chị cần quét văn bản của chị từ máy quét và phần mềm đi kèm máy quét của chị rồi lưu file vừa quét dưới dạng black and white.

sau đó từ VNDoc chị chọn chức năng Đọc ảnh thay vì chức năng Quét.

Em cũng chưa sử dụng phần mềm này lần nào, :)
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 26/02/08, 12:08
Quote from: saos@ngmo on 26/02/08, 10:17
Có thể phần mềm này không tích hợp được với máy quét chị đang sử dụng hoặc giả chị chưa biết cách, trong trường hợp đó chị cần quét văn bản của chị từ máy quét và phần mềm đi kèm máy quét của chị rồi lưu file vừa quét dưới dạng black and white.
Chị đã thử cách đó, lưu file dưới dạng black and white nhưng vẫn không sử dụng VnDOCR được.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 26/02/08, 12:10
Quote from: symphony on 26/02/08, 08:37
Hế hế, thế này thì cần phải tập huấn dài dài. Đề nghị chị ra Hà Nội thôi!
Ờ, chắc phải vậy.
Thôi tuần sau ra nhờ các "sư phụ" vậy.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: Sao_Online on 26/02/08, 15:52
Vậy quét bằng phần mềm kèm máy quét đi. HP Director ấy. Chắc chị vẫn quét bằng cái này?

Mở HP Director -> Chọn máy quét là HP Scanjet 5590 -> Chọn Settings -> Scan Picture Settings -> Khung Output Type chọn Black & White (1 bit) -> OK.

Bắt đầu Scan: Chọn Scan Picture -> Làm như những gì vẫn làm, quá dễ...

Quét xong -> Mở VNDOCR -> Đọc ảnh -> Chọn ảnh -> Làm như hướng dẫn ở bài trước. (Bắt đầu từ xử lý ảnh)!

Chúc thành công!
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 27/02/08, 15:57
Hi,
Chị đã thực hiện được rồi, đã phát hiện ra lý do tại sao mấy hôm trước lại không làm được: lỗi do driver. Sau khi cài đặt lại thì thực hiện được ngay. Thanks all.
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: saos@ngmo on 27/02/08, 16:11
Đó là vấn đề phụ, còn vấn đề chính của chị, độ chính xác thế nào ạ?
Title: Re: Cần chương trình convert sang Tiếng Việt
Post by: hangle124 on 28/02/08, 11:43
Độ chính xác rất cao (99%), chỉ một số chữ viết tắt (VD như đ/c) thì không nhận dạng được, biến thành chữ khác. Như vậy là quá đạt yêu cầu của chị rồi.  :P