Bài toán dự đoán ngôn ngữ
Đã bao giờ bạn sử dụng ứng dụng Google dịch và để ý tới chương trình dự đoán ngôn ngữ của Google không? Nếu bạn không để ý hay chưa biết thì hãy xem ảnh chụp màn hình sau đây:
Và sau khi bạn nhập thử một văn bản, thì kết quả như thế này đây:
Trong bài viết ngày hôm nay, Lập trình không khó sẽ giới thiệu cho các bạn một chương trình tương tự như vậy. Bật mí là chương trình dự đoán ngôn ngữ này có khả năng dự đoán cho 176 thứ tiếng khác nhau nhé.
Danh sách các ngôn ngữ có thể dự đoán:
af als am an ar arz as ast av az azb ba bar bcl be bg bh bn bo bpy br bs bxr ca cbk ce ceb ckb co cs cv cy da de diq dsb dty dv el eml en eo es et eu fa fi fr frr fy ga gd gl gn gom gu gv he hi hif hr hsb ht hu hy ia id ie ilo io is it ja jbo jv ka kk km kn ko krc ku kv kw ky la lb lez li lmo lo lrc lt lv mai mg mhr min mk ml mn mr mrj ms mt mwl my myv mzn nah nap nds ne new nl nn no oc or os pa pam pfl pl pms pnb ps pt qu rm ro ru rue sa sah sc scn sco sd sh si sk sl so sq sr su sv sw ta te tg th tk tl tr tt tyv ug uk ur uz vec vep vi vls vo wa war wuu xal xmf yi yo yue zh
Xây dựng chương trình dự đoán ngôn ngữ
Để có thể xây dựng và hiểu chương trình này, bạn cần có hiểu biết cơ bản về các kiến thức sau đây:
- Machine learning cơ bản
- Ngôn ngữ lập trình Python
Chương trình dự đoán ngôn ngữ này sử dụng pretrain model language identification của Fasttext. Xây dựng giao diện web sử dụng framework Flask trong Python.
Tất nhiên, bạn cũng có thể tự xây dựng mô hình dự đoán ngôn ngữ cho riêng mình. Tuy nhiên, việc chuẩn bị dữ liệu cho số lượng lớn ngôn ngữ sẽ tốn thời gian đó, bạn có thể thử với 2 hoặc 3 ngôn ngữ khác nhau. Phần tự train mô hình này nếu có thể tôi sẽ có một bài viết riêng. Còn mô hình pretrain này được huấn luyện để dự đoán cho 176 ngôn ngữ khác nhau các bạn ạ. Quá tuyệt vời phải không nào!
Ứng dụng dự đoán ngôn ngữ demo
Đây là 1 ảnh được chụp lại của ứng dụng dự đoán ngôn ngữ do mình xây dựng:
Các bạn có thể xem video dưới đây để biết cách chạy chương trình nhé.
Source code của chương trình các bạn có thể tìm và download tại tài khoản github của mình. Đừng quên star nếu thấy hay nhé!
Trả lời