Email thông báo tạo tài khoản, nhận bài, duyệt bài có thể vào Spam. Vui lòng kiểm tra Spam mail và Report Not Spam để email của hội thảo vào Inbox lần sau.

22 novembre 2024
Trường Đại học Ngoại ngữ - Tin học TP.HCM
Múi giờ Asia/Ho_Chi_Minh

TĂNG CƯỜNG HIỆU NĂNG ĐẶT DẤU CÂU TRONG CÂU ĐỐI HÁN VIỆT QUA VIỆC TẬN DỤNG TÀI NGUYÊN HÁN NGỮ

Không được lên lịch
15m
Phòng Hội thảo

Phòng Hội thảo

Tiểu ban khoa học tự nhiên, công nghệ Tiểu ban 1

Mô tả

Việc đặt dấu câu trong các câu đối là một thách thức lớn do ảnh hưởng từ ngữ pháp và cú pháp phức tạp của tiếng Hán cổ. Bằng cách tận dụng tài nguyên ngôn ngữ Hán cổ của Trung Quốc, chúng tôi đề xuất phương pháp kết hợp mô hình BERT, BiLSTM và CRF để tăng cường hiệu quả đặt dấu câu trong câu đối Hán-Việt. Kết quả thí nghiệm cho thấy mô hình BERT-BiLSTM-CRF vượt trội về độ chính xác so với các mô hình truyền thống trước đây. Về ý nghĩa, nghiên cứu này nhằm mục đích tăng cường hiệu quả xử lý tự động câu đối Hán Việt, giúp phục vụ các bài toán NLP khác trên miền văn bản này như dịch nghĩa, nhận diện thực thể chứa tên tốt hơn, góp phần bảo tồn và lan truyền những giá trị văn hóa và lịch sử của chúng.

Thông tin các tác giả

1/ Hoàng Thế Anh: Sinh viên, Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên – ĐHQG HCM. Số điện thoại: 0977407439. Email: htanh21@apcs.fitus.edu.vn.
2/ Đặng Hoàng Nhật Hưng: Sinh viên, Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên – ĐHQG HCM. Số điện thoại: 0964246503. Email: dhnhung21@apcs.fitus.edu.vn

Từ khóa

Câu đối Hán-Việt, đặt dấu câu, BERT, BiLSMT, CRF, xử lý ngôn ngữ tự nhiên

Tác giả chính

Anh Hoàng Thế (Trường Đại học Khoa học Tự nhiên, ĐHQG HCM)

Đồng tác giả

Đặng Hoàng Nhật Hưng (Trường Đại học Khoa học Tự nhiên, ĐHQG HCM)

Tài liệu trình bày

Không có tài liệu.