Email thông báo tạo tài khoản, nhận bài, duyệt bài có thể vào Spam. Vui lòng kiểm tra Spam mail và Report Not Spam để email của hội thảo vào Inbox lần sau.

22 novembre 2024
Trường Đại học Ngoại ngữ - Tin học TP.HCM
Múi giờ Asia/Ho_Chi_Minh

BƯỚC ĐẦU TÍCH HỢP TRI THỨC NHỊP THƠ VÀO MÔ HÌNH DỊCH NGHĨA TỰ ĐỘNG THƠ CHỮ HÁN VIỆT NAM SANG TIẾNG VIỆT HIỆN ĐẠI

Không được lên lịch
15m
Phòng Hội thảo

Phòng Hội thảo

Tiểu ban khoa học tự nhiên, công nghệ Tiểu ban 1

Mô tả

Thơ chữ Hán Việt Nam là những thi phẩm được các thi gia Việt Nam sáng tác bằng chữ Hán trong những thế kỷ trước. Với thế hệ người Việt hiện nay, giải mã những tác phẩm này sang tiếng Việt hiện đại là một trong những nhiệm vụ cấp thiết nhằm bảo tồn và phát huy những cái hay, cái đẹp của các bậc tiền nhân. Đứng trước nhiệm vụ này, các nhà nghiên cứu ngôn ngữ học máy tính đang dần đưa ra những mô hình tự động hoá việc giải mã từ tác vụ số hoá, phiên âm cho đến dịch nghĩa, trong đó dịch nghĩa vẫn là một bài toán thách thức nhất. Trong nghiên cứu này, dựa trên tri thức về nhịp – một trong những đặc trưng cơ bản của thơ, chúng tôi bước đầu đưa ra phương pháp tích hợp tri thức nhịp vào mô hình dịch nghĩa tự động với kiến trúc Transformer. Kết quả nghiên cứu cho thấy, tri thức về nhịp có nhiều tác động đến đến tác vụ dịch nghĩa thông qua việc cải thiện chất lượng dịch.

Từ khóa

Thơ chữ Hán Việt Nam, dịch nghĩa tự động, nhịp thơ, tri thức ngôn ngữ, Transformer

Thông tin các tác giả

1/ Thái Hoàng Lâm: Cử nhân, học viên cao học ngành Khoa học máy tính tại Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh, Việt Nam, email: lamhoangthai.work@gmail.com, SĐT: 0773956858
2/ Đinh Điền: PGS. TS, Giám đốc Trung tâm Ngôn ngữ học Tính toán, Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM, email: ddien@fit.hcmus.edu.vn

Tác giả chính

Thái Hoàng Lâm (Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia TP. HCM)

Đồng tác giả

Đinh Điền (Trường Đại học Khoa học Tự nhiên, ĐHQG TP.HCM)

Tài liệu trình bày

Không có tài liệu.