Trợ giúp:Hiệu đính

Văn thư lưu trữ mở Wikisource
Bước tới: chuyển hướng, tìm kiếm
Trợ giúp:Nội dung Hiệu đính
Viết tắt:
WS:HĐ
Trang trợ giúp này giới thiệu cách hiệu đính ở Wikisource. Nếu bạn muốn tìm thông tin về phần mở rộng Proofread Page, hoặc Wikisource:Hiệu đính của Tháng, hãy kiểm tra các liên kết trong phần "Xem thêm".

Phần mở rộng Proofread Page[sửa]

Xem thêm: Extension:Proofread Page

Phần mở rộng Proofread Page có thể kết xuất một cuốn sách thành một cột văn bản OCR bên cạnh một cột hình quét, hoặc chia thành các tổ chức hợp lý như các chương hoặc các bài thơ bằng cách nhúng chéo.

Mục đích của phần mở rộng này là để dễ dàng so sánh văn kiện với bản gốc và cho phép kết xuất văn kiện theo nhiều cách mà không cần sao chép dữ liệu. Vì các trang không nằm trong không gian chính nên chúng không được tính vào số lượng thống kê văn kiện.

Proofread Page được cài đặt trên mọi Wikisource.

Đọc văn kiện[sửa]

Các không gian tên Trang, Mục lục và không gian chính[sửa]

Không gian tên được dùng để phân biệt các loại trang ở Wikisource. Ví dụ, trang bạn đang đọc ở không gian tên "Trợ giúp:". Xem thêm Trợ giúp:Không gian tên.

  • Không gian tên Mục lục:, lưu trữ mục lục các văn kiện, hiển thị tất cả các trang của cùng một văn kiện. Ví dụ: Mục lục:Viet Nam Su Luoc 1.djvu. Một trang mục lục hiển thị chi tiết các thông tin xuất bản của văn kiện, liên kết đến trang Tập tin và thiết lập các liên kết đến các Trang của văn kiện. Mục lục có thể được sửa đổi để hiển thị số trang trong bản gốc. Loại trang này được phần mở rộng ProofreadPage sử dụng thông qua các nút điều hướng sau:
trang trước 1leftarrow.png, trang sau 1rightarrow.png và trở lại mục lục 1uparrow.png.
Các trang Mục lục ở wiki này được liệt kê ở Thể loại:Mục lục.
  • Không gian tên Trang: được dùng để hiển thị trang văn bản kề bên các trang hình ảnh riêng lẻ, và cho phép ghi lại văn kiện gốc. Ví dụ: Trang:Viet Nam Su Luoc 1.djvu/15. Bạn có thể phóng to thu nhỏ hình ảnh bằng cách click và cuộn hình ảnh trong khung bên phải.
Văn bản tương ứng với một hình ảnh được quét trên một trang mới thuộc không gian tên "Trang:" có tên khớp với tên hình ảnh. Ví dụ, trang "Trang:Viet Nam Su Luoc 1.djvu/15" sẽ tự động hiển thị hình "Hình:Viet Nam Su Luoc 1.djvu/15" ở bên phải. Số trang của các tập tin DjVu được chỉ ra bằng cách thêm một dấu gạch chéo, sau đó là số trang của tập tin. Ví dụ, Trang:Viet Nam Su Luoc 1.djvu/15 hiển thị trang thứ 15 của tập tin. Văn bản ở bên trái có thể sửa đổi được trong chế độ sửa đổi, chỉ có các nội dung trong hộp sửa đổi được hiển thị trên trang 'chính'.
Viết tắt:
G:DAUDE
Một số văn bản và định dạng có thể được đặt ở bên ngoài hộp sửa đổi, trong phần 'no-include'. Các hộp này có thể được mở bằng cách chọn Hiệu đính ở góc trên bên trái và bấm vào nút Button category plus.png. Đầu trang và chân trang sẽ được tự động đặt trong các thẻ <noinclude> để tránh nhúng chéo các nội dung này. Ví dụ ở Page:Cinderella (1865).djvu/5 ẩn đi đầu đề lặp lại ở mọi trang cùng với số trang.
Thẻ 1uparrow.png trên trang dùng để liên kết đến mục lục.
  • Không gian tên 'chính' sử dụng nhúng chéo để hiển thị một số trang trong một chương hoặc một phần của tác phẩm. Một liên kết ở bên trái liên kết đến không gian tên Trang:. Số trang gốc có thể được hiển thị trong liên kết, qua thông tin được ghi ở Mục lục. Văn bản ở đầu trang và chân trang trong không gian Trang: không được hiển thị.
Ở đầu trang sẽ có thêm một thẻ "Nguồn" để liên kết đến trang Mục lục: và một thanh chỉ thị màu để thể hiện tình trạng các trang được nhúng chéo. Ở thanh bên sẽ có thêm phần "Tùy chọn hiển thị", cho phép hiển thị văn bản theo 3 cách: Bố trí hẹp (mặc định tại Wikisource tiếng Việt), bố trí rộng và bố trí trái; cùng với tùy chọn 'Ẩn/Hiện liên kết trang' (mặc định là hiện).
Một trang trong không gian chính, như Việt Nam sử lược, hiển thị phần văn bản và minh họa cho tác phẩm.

Sửa đổi trang[sửa]

Các nút sau xuất hiện khi sửa đổi và điều hướng trong không gian tên Trang:

1leftarrow.png trang trước
1rightarrow.png trang sau
1uparrow.png mục lục
Button category plus.png hiện/ẩn đầu và chân của trang này
Button zoom out.png thu nhỏ
Button zoom in.png phóng to
Button examine.png cỡ bình thường

Quy ước định dạng[sửa]

Các quy ước sau đây được xem là tốt nhất cho các trang trong không gian tên Trang: (tập tin DjVu và các tập tin khác sử dụng phần mở rộng ProofreadPage). Các quy ước định dạng bài viết và các hướng dẫn chung xin xem ở Wikisource:Cẩm nang về văn phong.

  • Đầu trang và chân trang của một trang quét thường bao gồm số trang và tiêu đề không cần thiết cho trang mới. Hãy đặt thông tin trong phần 'no-include' bằng cách bấm vào nút Button category plus.png xuất hiện trong cửa sổ sửa đổi. Bản mẫu {{Chạy đầu trang}} rất hữu ích khi định dạng các đầu trang như thế này, và được dùng như sau:
{{Chạy đầu trang|trái=|giữa=|phải=}}
  • Văn bản ở các tham số 'trái', 'giữa' hoặc 'phải' sẽ hiển thị trên cùng một hàng.
  • Gỡ bỏ các dấu gạch nối cuối dòng và ngắt dòng. Để bắt đầu một đoạn mới, các trang media-wiki dùng hai lần tạo dòng mới.
  • Khi một từ được gạch nối trên hai trang khác nhau trong bản quét DjVu, hãy dùng {{hws}} and {{hwe}} (nếu bạn muốn, có thể dùng {{Hyphenated word start}} và {{Hyphenated word end}}). Các bản mẫu này sẽ làm cho từ xuất hiện dấu gạch nối trong không gian Trang: và gỡ bỏ dấu gạch nối khi nhúng chéo văn bản. Ví dụ: (Trang đầu tiênTrang thứ hai, kết quả ở trang chính"pretending")
{{hws|FIRST HALF OF WORD|WHOLE WORD}}
{{hwe|LAST HALF OF WORD|WHOLE WORD}}
  • Nếu một đoạn kết thúc ở dưới cùng của một trang DjVu và một đoạn mới trong cùng một chương sẽ bắt đầu ở trang kế tiếp, hãy thêm {{nop}} vào cuối trang để ngắt văn bản. Nếu không, khi các trang được nhúng chéo thì sự phân tách giữa hai trang sẽ chỉ là một khoảng trắng nhỏ chứ không phải là xuống dòng để bắt đầu một đoạn mới. Ví dụ: (Page:Personal Recollections of Joan of Arc.djvu/476Personal Recollections of Joan of Arc/Book III/Chapter 14).
Lưu ý: trước đây bản mẫu {{Blank line}} được dùng cho mục đích này ở đầu trang sau; {{nop}} hiện nay được ưa thích hơn.

Tình trạng trang[sửa]

Tình trạng của một trang được thể hiện thông qua màu sắc trên trang mục lục và qua thanh chỉ thị ở đầu trang. Phần mở rộng ProofreadPage được dùng để thể hiện tình trạng trang.

Đường dẫn kiểm tra của bộ mở rộng ProofreadPage gồm có năm cấp:

Không có nội dung
trang trống Chưa hiệu đính Đã hiệu đính Đã phê chuẩn
Có vấn đề


Ba giá trị đầu là quy trình thông thường:

  • Chưa hiệu đính là giá trị mặc định. (Xem tất cả các trang.)
  • Đã hiệu đính có nghĩa là đã được một đóng góp viên duyệt lại. (Xem tất cả các trang.)
  • Đã phê chuẩn có nghĩa là đã được duyệt bởi hai đóng góp viên. Nút tương ứng chỉ có nếu trang đã được một ai khác duyệt trước rồi. (Xem tất cả các trang.)

Ngoài ra,

  • Không có nội dung dành cho trang trắng, hoặc các trang khác không cần phải duyệt kép. (Xem tất cả các trang.)
  • Có vấn đề chỉ ra là có vấn đề cần thảo luận kỹ hơn giữa các đóng góp viên. (Xem tất cả các trang.)



Nhúng chéo[sửa]

Xem thêm: Trợ giúp:Ngắt trang

Sau khi văn bản của tác phẩm được phân bố vào mỗi trang hình ảnh kế bên, "nhúng chéo" được dùng để hiển thị văn bản từ không gian Trang: sang các trang trong không gian chính. Nhúng chéo hiển thị các trang của văn kiện mà không cần phải sao chép hay cập nhật chúng bằng tay sau này. Mục đích của việc nhúng chéo văn bản là để nhóm chúng thành các phần logic và có kích thước hợp lý-đa phần thành các chương hoặc các phần.

Một ví dụ hoàn chỉnh có ở Việt Nam sử lược/Quyển I. Sau khi các trang riêng lẻ của Mục lục:Viet Nam Su Luoc 1.djvu được gõ trong không gian "Trang:" (có thể xem một trang ở Trang:Viet Nam Su Luoc 1.djvu/23), văn bản này và các trang sau của chương thứ nhất được phân bố vào các chương khác nhau của cuốn sách trong không gian chính ở Việt Nam sử lược/Quyển I/Phần I/Chương I. Sau đây giải thích cách nhúng chéo để hiển thị dự án hiệu đính đã hoàn thành của bạn như một sản phẩm cuối cùng trong không gian chính của Wikisource.

Nhúng chéo toàn bộ trang[sửa]

Có hai cách để nhúng chéo toàn bộ trang. Hàm <pages> có thể hiển thị một loạt các trang, và bản mẫu {{Trang}} có thể hiển thị các trang riêng lẻ hoặc một phần của trang. Trong hầu hết trường hợp, thẻ <pages> sẽ là cách tốt nhất để nhúng chéo trong các chương. Cú pháp như sau:

  • <pages index="tên tập tin.djvu" from=20 to=40/>
  • from là trang đầu tiên;
  • to là trang cuối cùng.

Nếu bạn gặp phải vấn đề, hãy đặt câu hỏi ở Wikisource:Thảo luận.

Bản mẫu trang có thể nhúng chéo một trang duy nhất. Cú pháp như sau:

  • {{Trang|Viet Nam Su Luoc 1.djvu/23|số=11}}
  • Số trang được đặt sau một dấu gạch chéo (/) ở sau tên tập tin.
  • số xác định số trang vật lý, như số trang trong bản quét.

Nhúng chéo một phần trang[sửa]

Nếu hai phần khác nhau (ví dụ như phần cuối của một chương và phần bắt đầu của chương kế tiếp) xuất hiện trên cùng một trang, thì cần phải nhúng chéo chỉ một phần thích hợp của trang.

Điều này được thực hiện bằng cách sử dụng Labeled Section Transclusion (LST - nhúng chéo phần được dán nhãn). Các phần liên quan của trang được đánh dấu bằng thẻ section và khi nhúng chéo thì chỉ có phần liên quan của trang, chứ không phải toàn bộ trang, được hiển thị.

Để đánh dấu các phần trong không gian "Trang:", chèn cú pháp sau vào văn bản cần hiệu đính để dán nhãn vào cuối Phần I và đầu Phần II (cả hai đều trên cùng một trang):

  • <section begin=chapter1 />Đây là Chương 1.<section end=chapter1 />
  • <section begin=chapter2 />Đây là Chương 2.<section end=chapter2 />

Để thực hiện điều này, bản mẫu {{Trang}} được sử dụng như sau, thay thế "djvu" bằng tên tập tin djvu và "#" bằng số trang của văn bản cần hiển thị:

  • {{Trang|djvu/#|phần=chapter1}}
  • {{Trang|djvu/#|phần=chapter2}}

Bạn cũng có thể dùng thẻ <pages> để nhúng chéo một phần trang như sau:

  • <pages index="tên tập tin.djvu" from="20" to="20" onlysection="sectionA" />
(Trong trường hợp này, phạm vi trang chỉ bao gồm một trang duy nhất là trang 20)
  • onlysection là tên nhãn được gán cho các thẻ section có chứa nội dung muốn nhúng chéo.

Ngoài ra có thể dùng định dạng sau, thay thế "bài viết" bằng tên bài viết (không bao gồm không gian tên):

  • {{#section:Trang:bài viết|chapter1}}
  • {{#section:Trang:bài viết|chapter2}}

Kết hợp nhúng chéo nhiều trang và nhúng chéo một phần trang[sửa]

Để thêm nhiều trang, trong đó trang đầu tiên và/hoặc trang cuối cùng có thể cần nhúng chéo một phần, mã nguồn cho phép các tham số bổ sung để dùng với <pages>. Các tham số này là tùy chọn.

  • <pages index="tên tập tin.djvu" from=20 to=40 fromsection="choice A" tosection="choice B" />

Trang nhúng chéo hình ảnh[sửa]

Phương pháp được ưa thích để thay thế một bức tranh hoặc hình ảnh khác trong không gian trang chính là tải hình ảnh đã được cắt lên Wikimedia Commons như một hình ảnh riêng biệt, ví dụ như một tập tin png hoặc jpeg.

  • [[File:Title and number and subject.png|frameless|center]]

Có một cách tạm thời để hiển thị hình ảnh. Để hiển thị hình ảnh trong một trang của tập tin DjVu như tại Page:Personal Recollections of Joan of Arc.djvu/9, dùng:

  • {{use page image|Personal Recollections of Joan of Arc.djvu|9|caption=JOAN'S VISION}}

Trang hình ảnh cũng có thể được hiển thị trong không gian Wikisource của cuốn sách như ở Personal Recollections of Joan of Arc/Book I/Chapter 2, dùng:

  • [[Image:Personal_Recollections_of_Joan_of_Arc.djvu|page=27|right|thumbnail|200px|THE FAIRY TREE]]

Bắt đầu dự án hiệu đính[sửa]

Xem Trợ giúp:Tập tin DjVu

Hầu hết các dự án hiệu đính sử dụng tập tin djvu chứa các bản quét hoặc các hình ảnh của mỗi trang văn kiện, cùng với một lớp OCR đại diện cho văn bản được trích xuất. Để chuyển đổi định dạng .pdf sang định dạng .djvu (ngay cả các tập tin pdf "an toàn"), có thể dùng ứng dụng mã nguồn mở pdf2djvu.

Sửa đổi tập tin djvu[sửa]

Nhiều tập tin djvu đã được tạo ra ở archive.org và các trang web khác có trang bản quyền của Google ở mặt trước văn bản. Quy định của Wikimedia, dựa trên sự phân tích pháp luật cơ bản, không chấp nhận rằng bản quyền được thiết lập trên một tác phẩm thuộc phạm vi công cộng đơn giản chỉ bằng cách quét, sao chép hoặc tái tạo một bức ảnh hai chiều phản ánh trung thực tác phẩm. Xem Wikimedia Commons để biết thêm thông tin về các bản quét, tác phẩm nghệ thuậtquan điểm của WMF.

Các trang bản quyền như vậy và các tài liệu không liên quan khác có thể được gỡ bỏ bằng DjVuLibre, một chương trình mã nguồn mở được phát triển bởi các nhà phát minh ra djvu thông qua Giấy phép Công cộng GNU. Chương trình này dùng được trên Windows, Mac, Linux, Solaris, và IRIX. Nó bao gồm tập tin djvm.exe, được chạy bằng giao diện dòng lệnh. Nếu bạn không biết cách làm, bạn có thể nhắn tin cho Mkoyle (thảo luận), anh ấy sẽ làm giúp bạn và gửi email các tập tin cho bạn để tải lên. Dòng lệnh để xóa (-d) trang đầu tiên (1) như sau::

djvm -d filename.djvu 1

Tạo các tập tin Trang: để sửa đổi bằng cách nhìn hình kế bên[sửa]

Xem Trợ giúp:Hướng dẫn ban đầu cho các tập tin Mục lục:

Sau khi một tài liệu .djvu được tạo ra và tải lên, hãy tạo một mục lục mới với tên là "Mục lục:[tên tập tin tại Wikimedia Commons]" bằng cách dùng Mediawiki:Proofreadpage index template. Sao chép danh sách tham số đầy đủ và điền vào những gì bạn có thể. Đặt tham số "Progress=MS" and "Trang=<pagelist />". Bạn nên dùng liên kết wiki trong tham số "Tựa đề" chỉ đến trang văn kiện ở Wikisource (có thể cùng tên với tập tin mục lục, nhưng không bao gồm "Mục lục:").

Các tập tin mới cho mỗi trang trong không gian tên Trang: được tạo ra cho tập tin bằng cách dùng ThomasBot. Xem thông tin ở Trợ giúp:Gộp và tách.

Thảo luận[sửa]

Phần mở rộng Proofread page cung cấp một văn bản được trích xuất và một bản quét của văn bản gốc trên cùng một trang. Các trang này sử dụng tiền tố Trang: và tập hợp các trang này được hiển thị trên một trang bắt đầu bằng tiền tố Mục lục:. Trong khi phần mở rộng hỗ trợ nhiều loại tập tin thì một văn bản ở Wikisource thường là DjVu với phần mềm OCR

Phần mở rộng ProofreadPage được kích hoạt theo mặc định tại Wikisource và tự động hoạt động khi một trang trong không gian "Trang:" được sửa đổi. Tuy nhiên, để hoạt động được thì trình duyệt của biên tập viên (và các phần mở rộng như NoScript) phải cho phép xử ký kịch bản. Trang Đặc biệt:Tùy chọn (phần "Công cụ đa năng") cho phép bạn điều khiển các tính năng nhất định, chẳng hạn như kích hoạt nút OCR hay cho phép văn bản xuất hiện kế bên theo mặc định hoặc xuất hiện ở bên trên.

Các thành viên mới hiệu đính có thể thử nghiệm các khái niệm, và kiểm tra khả năng của mình qua những thử nghiệm đơn giản được giới thiệu trên trang web Distributed Proofreading. Có thể tìm các ví dụ tại một dự án đang được xử lý, như ở Wikisource:Hiệu đính của Tháng.

Sau khi tìm thấy một dự án mà bạn muốn làm việc, bạn sẽ đi đến trang mục lục. Ở đó bạn sẽ tìm thấy các liên kết đến nhiều trang của dự án, và có màu sắc khác nhau theo tình trạng của chúng. Sau khi chọn một trang cần làm (không phải màu xanh lá cây), bạn sẽ đi đến trang đó, mở cửa sổ sửa đổi và thực hiện bất cứ thay đổi thích hợp nào (cả trên văn bản lẫn tình trạng), xem thử và lưu trang.

Bất kỳ ai cũng có thể hiệu đính và sửa chữa hầu hết các trang tại Wikisource. Tuy nhiên, các biên tập viên cần đăng nhập bằng một tài khoản để thay đổi tình trạng hiệu đính. IP không thể thay đổi tình trạng này.

Khi công việc sửa chữa và định dạng đã hoàn thành, trang được đánh dấu là đã hiệu đính và sẵn sàng nhúng vào không gian chính, hãy bỏ các trang 'chưa được hiệu đính' cho đến khi chúng được hiệu đính. Đánh dấu là có vấn đề nếu trang có vấn đề.

Cơ sở[sửa]

Wikisource sử dụng phần mở rộng ProofreadPage, cho phép hiển thị văn bản cùng với hình quét tương ứng trên cùng một trang. Nó được thiết kế cho phép dễ dàng so sánh văn kiện với bản gốc. Nó có những ưu điểm sau đây:

  • Đáng tin cậy: Nó đảm bảo rằng văn kiện tại Wikisource đúng với nguồn quét của nó.
  • Cải thiện sự cộng tác: văn kiện có thể được hiệu đính và sửa lỗi chính tả bởi tất cả mọi người, bằng cách truy cập trực tiếp vào cuốn sách. Điều này khôi phục sự cộng tác trên wiki.
  • An toàn: văn kiện được bảo vệ tốt hơn khỏi phá hoại (mọi giả mạo có thể được phát hiện ngay lập tức; văn kiện không được truy cập trực tiếp mà thông qua nhúng chéo, ngăn cản những kẻ phá hoại thiếu kinh nghiệm)
  • Không hạn chế kết xuất: một cuốn sách có thể được kết xuất theo hai cách mà không cần nhân đôi dữ liệu:
  1. Một tập hợp các trang: Mỗi trang là một cột văn bản OCR, bên cạnh là một cột hình quét. Chế độ này dành cho đóng góp viên.
  2. Chia thành các tổ chức hợp lý (như các chương hoặc các bài thơ), sử dụng nhúng chéo. Chế độ này dành cho độc giả.
  • Công bằng khi so sánh: khi các trang sách không có trong không gian 'chính', chúng không được tính vào số lượng thống kê văn kiện. Số lượng các trang được tính ở đây. Phương pháp so sánh này dùng cùng một đơn vị đo lường cho mọi văn kiện (trang), đặt dấu chấm hết cho việc tự ý chia văn kiện thành nhiều phần nhỏ để tăng số liệu thống kê.

Hạn chế[sửa]

Thẻ poem không hoạt động tốt vì nó thêm một dấu xuống dòng ở cuối khối. Cũng không thể dùng được định dạng <pre>, do các dấu ngắt dòng bị nén khi nhúng chéo. Để khắc phục hãy thêm thẻ <br /> ở đầu dòng.

Để dễ dàng hiệu chỉnh các hình ảnh được xoay, có thể sử dụng phần mở rộng Rotate Image của Firefox.

Lỗi[sửa]

  • Lỗi 32.792: Thẻ "Nguồn" và thanh tiến triển trên các trang văn kiện bị gãy.
  • Lỗi 43.284: Thẻ <pagelist> trên các trang Mục lục bị gãy.

Xem thêm[sửa]

  • Thể loại:Mục lục thể loại mục lục các trang quét của các tác phẩm đã được hiệu đính hoặc phê chuẩn

Tác phẩm cần hiệu đính[sửa]

Artículo bueno.svg

Tác phẩm cần Hiệu đính của Tháng
Việt Nam sử lược, Quyển II của

Lệ-thần Trần Trọng Kim.

Tháng trước: Việt Nam sử lược, Quyển I
Mời các thành viên quan tâm hiệu đính tác phẩm để nâng cao sự toàn vẹn và tin cậy của Wikisource.