Title: | Ứng dụng thuật toán học máy cải thiện vấn đề mất cân bằng dữ liệu để dự đoán hiệu quả của quảng cáo trên sàn thương mại điện tử cho doanh nghiệp vừa và nhỏ |
Author(s): | Trương Nguyễn Ngọc Yến |
Advisor(s): | Dr. Nguyễn Mạnh Tuấn |
Keywords: | Dữ liệu mất cân bằng; Dự đoán hiệu quả quảng cáo; Học máy; Imbalanced data; Advertising effectiveness prediction; Machine learning |
Abstract: | Các doanh nghiệp vừa và nhỏ chiếm trọng số lớn trong cơ cấu nền kinh tế, đặc biệt lĩnh vực thương mại điện tử, đang gặp thách thức với việc ra quyết định bằng dữ liệu vì vấn đề liên quan đến dữ liệu mất cân bằng, và nguồn lực hạn chế. Do đó, đề tài "Ứng dụng thuật toán học máy cải thiện vấn đề mất cân bằng dữ liệu để dự đoán hiệu quả của quảng cáo trên sàn thương mại điện tử cho doanh nghiệp vừa và nhỏ" tập trung giải quyết một thách thức cốt lõi và phổ biến mà các doanh nghiệp SME phải đối mặt: dự đoán các chiến dịch quảng cáo tiềm năng thành công từ bộ dữ liệu có sự mất cân bằng nghiêm trọng giữa lớp hiệu quả và không hiệu quả. Phương pháp luận chính của đề tài là thiết kế một thực nghiệm so sánh hai luồng: thứ nhất là huấn luyện các mô hình học máy trên dữ liệu gốc và thứ hai là huấn luyện các mô hình trên dữ liệu đã được xử lý cân bằng bằng ba kỹ thuật oversampling tiên tiến như Borderline-SMOTE, ADASYN, và SMOTEENN. Một loạt các thuật toán như XGBoost, Decision Tree, SVM, Logistics Regression, Random Forest, KNN, Naïve Bayes và Neural Networks được sử dụng và đánh giá qua các chỉ số như Recall, F1- score, cũng như ma trận nhầm lẫn và đường cong học để đo lường khả năng nhận diện lớp thiểu số. Kết quả nghiên cứu cho thấy, các mô hình khi huấn luyện trên dữ liệu gốc hoàn toàn thất bại trong việc xác định các chiến dịch hiệu quả. Tuy nhiên, khi sử dụng kỹ thuật Boderline_SMOTE kết hợp mô hình Neural Network cho kết quả dự đoán tốt và ổn định, thành công phát hiện chiến dịch tiềm năng hiệu quả. Kỹ thuật ADASYN cho kết quả kém ổn định, tính tổng quát hóa chưa tốt. Kỹ thuật SOMTEENN – là một kỹ thuật hiện đại nhưng cho kết quả hoàn toàn thất bại. Nghiên cứu này đã cung cấp một phương pháp luận thực tiễn và các kết quả có giá trị, giúp các doanh nghiệp SME có một cơ sở khoa học để tối ưu hóa chiến lược quảng cáo, giảm thiểu chi phí và tăng doanh thu trên các nền tảng thương mại điện tử. |
Issue Date: | 2025 |
Publisher: | Đại học Kinh tế Thành phố Hồ Chí Minh |
URI: | https://digital.lib.ueh.edu.vn/handle/UEH/76395 |
Appears in Collections: | MASTER'S PROJECTS
|