Đề tài trên Thảo luận Thành viên:Vinhtantran/Lưu Thảo luận Cấu trúc 1

OCR

9 bình luận • 07:01, ngày 5 tháng 12 năm 2021 2 năm trước

9

Giữa Tesseract OCR và Google OCR, cái nào nhận dạng tiếng Việt tốt hơn?

Trả lời 06:54, ngày 5 tháng 8 năm 2021 2 năm trước

Theo kinh nghiệm của anh với mấy cuốn của Tân Dân Tử thì Google tốt hơn. Hồi nút OCR mới được đặt lên Wikisource, Tesseract còn không hỗ trợ quét được tiếng Việt. Bây giờ thì được rồi.

Trả lời 12:35, ngày 5 tháng 8 năm 2021 2 năm trước

Tranminh360 (thảo luậnđóng góp)

Google OCR hay gặp tình trạng chữ ở dòng trên nhảy xuống dòng dưới hoặc nhảy xuống cuối trang, nhất là những trang có dấu — như Trang:Phật giáo.pdf/45.

Trả lời 07:14, ngày 15 tháng 8 năm 2021 2 năm trước

Vinhtantran (thảo luậnđóng góp)

Nhưng dù sao nó vẫn nhận diện chữ tốt hơn Tesseract.

Trả lời 00:39, ngày 20 tháng 8 năm 2021 2 năm trước

Tranminh360 (thảo luậnđóng góp)

Google OCR báo lỗi: We can not access the URL currently. Please download the content and pass it in thì phải làm sao?

Trả lời 02:07, ngày 4 tháng 9 năm 2021 2 năm trước

Vinhtantran (thảo luậnđóng góp)

Lỗi kỹ thuật của Google. Em có thể dùng tạm trang này https://ws-google-ocr.toolforge.org/ bằng cách dán liên kết ảnh trực tiếp vào. Google OCR không miễn phí, nó chỉ cấp API đặc biệt cho Wikimedia nên không có cách nào khác.

Trả lời 03:01, ngày 4 tháng 9 năm 2021 2 năm trước

Tranminh360 (thảo luậnđóng góp)

Em không hiểu tại sao trang https://ocr.wmcloud.org/ báo lỗi trong khi trang https://ws-google-ocr.toolforge.org/ lại hoạt động? Đây là 2 công cụ khác nhau à?

Trả lời 07:39, ngày 7 tháng 9 năm 2021 2 năm trước

Vinhtantran (thảo luậnđóng góp)

Cái này thì anh không biết.

Trả lời 14:42, ngày 7 tháng 9 năm 2021 2 năm trước

Tranminh360 (thảo luậnđóng góp)

Bây giờ trang https://ws-google-ocr.toolforge.org/ đổi hướng đến https://ocr.wmcloud.org/ rồi, và Google OCR toàn báo lỗi không truy cập được URL. Có trang em bấm nút "Tách văn bản" cả chục lần mà cũng chẳng thấy ra. Chán quá đành chuyển sang dùng Tesseract vậy.

Trả lời Đã sửa đổi 07:01, ngày 5 tháng 12 năm 2021 2 năm trước

Trả lời “OCR”