Chương trình dự đoán ngôn ngữ như Google Dịch

Bài toán dự đoán ngôn ngữ

Đã bao giờ bạn sử dụng ứng dụng Google dịch và để ý tới chương trình dự đoán ngôn ngữ của Google không? Nếu bạn không để ý hay chưa biết thì hãy xem ảnh chụp màn hình sau đây:

Chức năng phát hiện ngôn ngữ của Google Dịch

Và sau khi bạn nhập thử một văn bản, thì kết quả như thế này đây:

Chức năng phát hiện ngôn ngữ của Google Dịch
Chức năng phát hiện ngôn ngữ của Google Dịch(ảnh chụp màn hình)

Trong bài viết ngày hôm nay, Lập trình không khó sẽ giới thiệu cho các bạn một chương trình tương tự như vậy. Bật mí là chương trình dự đoán ngôn ngữ này có khả năng dự đoán cho 176 thứ tiếng khác nhau nhé.

Danh sách các ngôn ngữ có thể dự đoán:

Mình xin 5 phút quảng cáo nha =))

Xây dựng chương trình dự đoán ngôn ngữ

Để có thể xây dựng và hiểu chương trình này, bạn cần có hiểu biết cơ bản về các kiến thức sau đây:

Chương trình dự đoán ngôn ngữ này sử dụng pretrain model language identification của Fasttext. Xây dựng giao diện web sử dụng framework Flask trong Python.

Tất nhiên, bạn cũng có thể tự xây dựng mô hình dự đoán ngôn ngữ cho riêng mình. Tuy nhiên, việc chuẩn bị dữ liệu cho số lượng lớn ngôn ngữ sẽ tốn thời gian đó, bạn có thể thử với 2 hoặc 3 ngôn ngữ khác nhau. Phần tự train mô hình này nếu có thể tôi sẽ có một bài viết riêng. Còn mô hình pretrain này được huấn luyện để dự đoán cho 176 ngôn ngữ khác nhau các bạn ạ. Quá tuyệt vời phải không nào!

Ứng dụng dự đoán ngôn ngữ demo

Đây là 1 ảnh được chụp lại của ứng dụng dự đoán ngôn ngữ do mình xây dựng:

Chương trình dự đoán ngôn ngữ
Chương trình dự đoán ngôn ngữ demo

Các bạn có thể xem video dưới đây để biết cách chạy chương trình nhé.

Source code của chương trình các bạn có thể tìm và download tại tài khoản github của mình. Đừng quên star nếu thấy hay nhé!

avatar
  Subscribe  
Notify of