| Title: | Phân tích cảm xúc và đo lường mức độ hài lòng của khách hàng về khách sạn tại Việt Nam sử dụng học máy trên dữ liệu bình luận từ Agoda.com |
Author(s): | Phạm Ngô Quốc Huy |
Advisor(s): | Dr. Trương Việt Phương |
Keywords: | Phân tích cảm xúc; Đo lường mức độ hài lòng khách hàng; Học máy; Bình luận trực tuyến khách sạn; Agoda.com; entiment Analysis; Customer Satisfaction Measurement; Machine Learning; Online Hotel Reviews |
Abstract: | Nghiên cứu được thực hiện trong bối cảnh ngành du lịch Việt Nam phục hồi mạnh sau COVID-19 và xu hướng khách hàng ngày càng phụ thuộc vào bình luận trực tuyến khi đưa ra quyết định đặt phòng. Với 95% du khách đọc đánh giá trực tuyến trước khi đặt dịch vụ (TrustYou, 2022), dữ liệu từ các OTA đặc biệt là Agoda trở thành nguồn thông tin có giá trị cao đối với cả doanh nghiệp và cơ quan quản lý du lịch. Tuy nhiên, các nghiên cứu trước chủ yếu dùng dữ liệu từ TripAdvisor/Booking, trong khi nghiên cứu hệ thống trên nền tảng Agoda tại Việt Nam còn hạn chế; đồng thời, việc phân tích thủ công khó đáp ứng khối lượng dữ liệu lớn và đặc thù ngôn ngữ đa dạng.Nghiên cứu này xây dựng một quy trình ứng dụng học máy để tự động thu thập, tiền xử lý, gán nhãn, phân loại cảm xúc và xếp hạng mức độ hài lòng của khách hàng dựa trên dữ liệu bình luận tiếng Việt trên Agoda.com. Tập dữ liệu gồm 2.000 bình luận tiếng Việt của khách du lịch về 80 khách sạn tại 29 tỉnh/thành, sau khi đã tiền xử lý và lọc từ bộ dữ liệu gốc. Gán nhãn được thực hiện bán tự động dựa trên điểm rating (≥7,0 = “hài lòng”; “không hài lòng”), cho ra 1.282 bình luận tích cực và 718 bình luận tiêu cực. Kết quả cho thấy 34 khách sạn đạt mức 3 điểm, chiếm tỷ trọng lớn nhất và phản ánh chất lượng dịch vụ “khá hài lòng” của phần lớn thị trường; 21 khách sạn đạt mức 4, và 6 khách sạn đạt mức 5 điểm — thể hiện nhóm chất lượng vượt trội. Chỉ có 2 khách sạn ở mức 1 điểm, cần được ưu tiên cải thiện dịch vụ. Hệ thống xếp hạng này giúp nhận diện rõ mức độ hài lòng theo từng khách sạn và hỗ trợ nhà quản lý trong việc đánh giá chất lượng dịch vụ theo thời gian thực.Bên cạnh kết quả tích cực, nghiên cứu ghi nhận một số hạn chế như phạm vi dữ liệu còn hẹp (chỉ từ Agoda), rủi ro sai lệch khi dựa vào rating để gán nhãn, và chưa ứng dụng các mô hình ngôn ngữ hiện đại như BERT, PhoBERT hay LLMs. Từ đó, đề tài đề xuất bộ giải pháp xây dựng hệ thống phân tích cảm xúc hoàn chỉnh, bao gồm: thu thập dữ liệu đa nguồn; tự động hóa tiền xử lý; áp dụng Logistic Regression làm mô hình nền tảng; mở rộng mô hình bằng các kỹ thuật hiện đại; xây dựng dashboard quản trị; và thiết lập cơ chế phản hồi – cải thiện dịch vụ tự động. Đề tài đóng góp cả về ý nghĩa khoa học mở rộng nền tảng đo lường sự hài lòng từ dữ liệu phi cấu trúc bằng ML trong lĩnh vực du lịch–khách sạn Việt Nam ý nghĩa thực tiễn là cung cấp công cụ hỗ trợ ra quyết định nhanh, chi phí thấp, theo dõi liên tục chất lượng dịch vụ khách sạn. Kết quả nghiên cứu khẳng định tiềm năng lớn của việc ứng dụng học máy và NLP trong quản trị trải nghiệm khách hàng trong ngành lưu trú. |
Issue Date: | 2025 |
Publisher: | Đại học Kinh tế Thành phố Hồ Chí Minh |
URI: | https://digital.lib.ueh.edu.vn/handle/UEH/77960 |
| Appears in Collections: | MASTER'S PROJECTS
|