Cách dịch tài liệu PDF

Tải lên tài liệu PDF của bạn rồi nhấn Enter!

Lưu ý: Hiện ứng dụng dịch tốt nhất với các file PDF mà văn bản có thể quét được (đại khái là nếu bạn dùng chuột copy được văn bản), với các file PDF scan dạng ảnh hoặc ảnh chụp nó vẫn dịch được nhưng có thể không được tốt như file PDF chuẩn.

silaTranslator mạnh ở dịch web hơn, nhưng khả năng dịch PDF của nó cũng rất tốt. Tại trang dịch web, bạn hãy vào khu vực này để chuyển sang phần dịch PDF.

Ở giao diện chính, bạn nhìn sang phải sẽ thấy sidebar, click vào biểu tượng trên để truy cập phần dịch PDF.

Tại giao diện của trang dịch PDF, bạn nhấp vào ô để tải tài liệu PDF từ máy tính của bạn lên ứng dụng.

Ví dụ tôi tải một file PDF từ máy tính lên ứng dụng.

Sau đó bạn click vào Dịch PDF. So với dịch web thì dịch PDF có thể lâu hơn một chút. Ngoài ra dịch PDF có giới hạn, bạn chỉ nên dịch các tài liệu tiếng Anh có độ dài dưới 25 ngàn từ.

Tương tự dịch web, thì dịch PDF cũng là tác vụ phức tạp (thậm chí còn phức tạp hơn do ngoài nhiệm vụ dịch còn tốn công phân tích và điều chỉnh định dạng), bạn nên chọn model cao nhất trong khả năng.

-

Đặc điểm của dịch PDF:

  • Ưu tiên chất lượng dịch hơn giữ định dạng gốc, mặc dù nó vẫn cố gắng bảo toàn định dạng gốc nhiều nhất có thể.

  • Tập trung vào dịch văn bản. Ứng dụng tập trung nỗ lực cho dịch văn bản, tuy vậy nếu file PDF chứa các biểu đồ không quá phức tạp nó cũng sẽ được dịch, và cấu trúc lại để hiển thị cho người đọc.

  • Tối ưu cho nhiệm vụ dịch các tài liệu học thuật. Hiện các hướng dẫn cho AI (còn gọi là SI & prompt) của phần dịch PDF được định hướng tối ưu cho chức năng dịch các tài liệu khoa học, nhưng nó vẫn đảm bảo dịch tốt các tài liệu thông thường khác.

  • Các ảnh trong file PDF nếu là dạng ảnh chụp (ví dụ ảnh chụp đồ vật, phong cảnh, chân dung) sẽ không được đưa vào file dịch.


1. Thông báo dịch xong

Sau khi dịch xong, ứng dụng sẽ thông báo thời gian cần thiết để dịch & đường link để bạn đọc bản dịch (bản dịch được lưu ngay trong máy của bạn).

Dịch thành công tài liệu PDF.

Ví dụ về một file PDF được dịch sang tiếng Việt:

Trong phần dịch PDF, AI sẽ toàn quyền điều chỉnh giao diện PDF, nó sẽ cố gằng bảo toàn định dạng gốc nhưng ưu tiên chất lượng dịch hơn. Nếu dạng gốc chia văn bản thành 2 cột, nó sẽ được chuyển thành một cột trong bản dịch.

2. Tùy chọn dịch nâng cao cho PDF

PDF cũng có tùy chọn dịch nâng cao giống như bên dịch web, với phương pháp tương tự (sử dụng SI, prompt mẫu & kết hợp với file PDF để tạo ra SI & prompt mới phù hợp hơn).

Biểu tượng thì khác một chút, bên PDF dùng hình vuông chứ không phải tròn (mục đích là để bạn đỡ nhầm lẫn giữa hai bên).

Hình vuông màu chì, dịch PDF đang ở chế độ thông thường

Lưu ý là tùy chọn dịch nâng cao của web và PDF hoàn toàn độc lập với nhau (tức là tắt bật là riêng từng khu vực).

Hình vuông màu xanh dương, dịch PDF đang ở chế độ nâng cao

Một điểm khác bạn cần quan tâm: Tùy chọn dịch nâng cao bên PDF cần dùng có chọn lọc hơn so với bên web. Nguyên nhân là vì dịch PDF tương đối tồn chi phí (nhất là đầu vào, cũng may là thường chi phí đầu vào rẻ hơn khá nhiều so với đầu ra), ngoài ra nó cũng tốn thời gian hơn đáng kể ở chế độ dịch nâng cao.

Câu lệnh ban đầu cho AI đối với PDF nhìn chung được tối ưu tương đối sâu nên có thể bạn sẽ thấy chế độ dịch nâng cao bên PDF sẽ đem lại cải tiến chất lượng không nhiều được như bên web (ví dụ dịch nâng cao bên web có thể đem lại cải tiến 10 - 20%, còn dịch nâng cao bên PDF có thể chỉ đem lại cải tiến 5 - 10% so với chế độ dịch thông thường). Một lý do khác cho chuyện này là bên PDF phải phân tán một phần năng lực cho nhiệm vụ định dạng (trong khi đó bên web, nhiệm vụ này được ứng dụng tạo mặc định phần lớn, và dữ liệu đầu vào của nó đơn giản hơn nhiều so với bên PDF).


3. Hiển thị các file PDF đã dịch

PDF cũng lưu lại các file trên máy của bạn & mặc định thông báo 10 file dịch gần đây nhất ở mục Hiện các file PDF đã dịch.

Xem các file đã dịch.

Điều đó giúp bạn xem lại các file mà bạn đã dịch trước đây, ngoài ra nó cũng thông báo cụ thể thư mục chứa các file đó (chứa tất cả các bản dịch của file PDF), cùng với thống kê về dung lượng (lưu ý là thư mục bên dịch PDF và dịch web là 2 thư mục lưu khác nhau):

Hiển thị thống kê trong thư mục.

Thư mục chứa các file dịch bên PDF sẽ là (bắt đầu từ ổ C, xong vào dần các thư mục con):

C > silaTranslator > www > silaTranslator > pdf_html_show


Phần tiếp: Tìm kiếm như người bản xứ!

Last updated