Cách crawl dữ liệu web hay cách thu thập dữ liệu web là một thắc mắc của khá nhiều bạn. Lý do bởi hiện nay, có vô vàn các website ở đủ mọi lĩnh vực cung cấp cho chúng ta rất nhiều thông tin hữu ích. Đôi khi, chúng ta sẽ muốn tổng hợp lại […]
Data Engineer
Bài 15. Biến toàn cục và biến cục bộ trong C#
Biến toàn cục và biến cục bộ khái niệm này được sinh ra khi mà các ngôn ngữ lập trình tiến hành thu dọn bộ nhớ sau mỗi lần thực hiện hàm hoặc khối lệnh. Việc xuất hiện khái niệm này khiến đối lúc gây khó chịu đối với người học lập trình, nhưng khái […]
Bài 14. Hàm đệ quy trong C#
Đệ quy (recursion) là một phần khá trừu tượng và cũng tương đối là khó hiểu đối với những bạn mới tiếp xúc với lập trình. Nên trong bài viết này hôm nay mình sẽ cố gắng trình bày một cách dễ hiểu nhất cho cả những bạn đã nắm bắt sơ sơ về lập […]
Bài 8.2 Vòng lặp while, do while trong C#
Trong bài học ngày hôm nay, mình sẽ giới thiệu cho các bạn vòng lặp while và vòng lặp do while. Đây là 2 cấu trúc lặp tiếp theo trong 4 cấu trúc có mặt trong C#. Riêng cấu trúc lặp cuối cùng là vòng lặp foreach mình sẽ trình bày trong chương mảng 1 […]
Trích rút từ khóa tự động với học không giám sát
Trích rút từ khóa là một trong những phương pháp đơn giản nhất giúp cho việc phân tích & khai thác các giá trị từ dữ liệu văn bản. Bài toán trích rút từ khóa (tiếng anh: Keyword Extraction hoặc Keyphare Extraction) là quá trình tự động trích rút ra các từ khóa/ thuật ngữ […]