Mô tả
Thơ chữ Hán Việt Nam là những thi phẩm được các thi gia Việt Nam sáng tác bằng chữ Hán trong những thế kỷ trước. Với thế hệ người Việt hiện nay, giải mã những tác phẩm này sang tiếng Việt hiện đại là một trong những nhiệm vụ cấp thiết nhằm bảo tồn và phát huy những cái hay, cái đẹp của các bậc tiền nhân. Đứng trước nhiệm vụ này, các nhà nghiên cứu ngôn ngữ học máy tính đang dần đưa ra những mô hình tự động hoá việc giải mã từ tác vụ số hoá, phiên âm cho đến dịch nghĩa, trong đó dịch nghĩa vẫn là một bài toán thách thức nhất. Trong nghiên cứu này, dựa trên tri thức về nhịp – một trong những đặc trưng cơ bản của thơ, chúng tôi bước đầu đưa ra phương pháp tích hợp tri thức nhịp vào mô hình dịch nghĩa tự động với kiến trúc Transformer. Kết quả nghiên cứu cho thấy, tri thức về nhịp có nhiều tác động đến đến tác vụ dịch nghĩa thông qua việc cải thiện chất lượng dịch.
Từ khóa
Thơ chữ Hán Việt Nam, dịch nghĩa tự động, nhịp thơ, tri thức ngôn ngữ, Transformer
Thông tin các tác giả
1/ Thái Hoàng Lâm: Cử nhân, học viên cao học ngành Khoa học máy tính tại Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh, Việt Nam, email: lamhoangthai.work@gmail.com, SĐT: 0773956858
2/ Đinh Điền: PGS. TS, Giám đốc Trung tâm Ngôn ngữ học Tính toán, Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, email: ddien@fit.hcmus.edu.vn