KHAI PHÁ KHO DỮ LIỆU TRONG THƯƠNG MẠI ĐIỆN TỬ
21-08-2023 09:29 AM
Hiện nay, với sự phát triển vượt bật của công nghệ thông tin, các hệ thống thông tin có thể lưu trữ một khối lượng dữ liệu lớn. Trong kho dữ liệu lớn đó không phải thông tin nào cũng có ích. Vì vậy để khai thác được những tri thức có ích đó các phương pháp Khai phá dữ liệu ra đời. Chúng cho phép chúng ta trích xuất những thông tin hữu ích mà chúng ta chưa biết. Các tri thức vừa tìm thấy có thể vận dụng để cải thiện hiệu quả hoạt động của hệ thống thông tin ban đầu.
Khai phá dữ liệu có thể định nghĩa là việc khám phá tri thức trong cơ sở dữ liệu, là một quá trình trích xuất những thông tin ẩn, trước đây chưa biết và có khả năng hữu ích trong cơ sở dữ liệu.
Quá trình Khai phá dữ liệu bao gồm 5 giai đoạn chính như sau:
Xác định vấn đề và không gian dữ liệu để giải quyết vấn đề (Problem understanding and data understanding).
Chuẩn bị dữ liệu (Data preparation), bao gồm các quá trình làm sạch dữ liệu (data cleaning), tích hợp dữ liệu (data integration), chọn dữ liệu (data selection), biến đổi dữ liệu (data transformation).
Khai phá dữ liệu (Data mining): xác định nhiệm vụ khai phá dữ liệu và lựa chọn kĩ thuật khai phá dữ liệu. Kết quả cho ta một nguồn tri thức thô.
Đánh giá (Evaluation): dựa trên một số tiêu chí tiến hành kiểm tra và lọc nguồn tri thức thu được.
Triển khai (Deployment).
Hiện nay có rất nhiều lĩnh vực ứng dụng khai phá dữ liệu như: thiên văn học, tin sinh học, bào chế thuốc, thương mại điện tử, phát hiện gian lận, quảng cáo, marketing, quản lý quan hệ khách hàng, chăm sóc sức khỏe, viễn thông, thể thao, giải trí, đầu tư, máy tìm kiếm… Trong đó khai phá dữ liệu hương mại điện tử là một trong những lĩnh vực thu hút nhiều nghiên cứu những năm gần đây.
Khai phá dữ liệu trong Thương mại điện tử nhằm phát hiện ra các tri thức mới, tri thức có ích trong giao dịch Thương mại điện tử. Tri thức này có thể là thông tin về các bên giao dịch, thông tin về các sản phẩm giao dịch hay xu thế mua hàng trong các phiên giao dịch giữa hai bên, .... Thương mại điện tử đang phát triển mạnh mẽ theo xu thế toàn cầu hoá, do vậy phát hiện tri thức mới có rất nhiều ý nghĩa và được ứng dụng chủ yếu trên khía cạnh giao dịch thông qua mạng máy tính. Khai phá dữ liệu trong Thương mại điện tử thực hiện trên cơ sở dữ liệu giao dịch giữa khách hàng và nhà cung cấp sản phẩm.
Việc tạo ra một hệ thống dồn tất cả dữ liệu vào một nơi duy nhất mang lại những lợi ích cho ngành TMĐT sau:
Tìm kiếm insight nhanh hơn: Trước khi muốn phân tích dữ liệu thường cần thu thập dữ liệu trước. Nếu đã có sẵn hệ thống thu thập, lưu trữ tất cả dữ liệu liên quan, doanh nghiệp có thể lấy đó và phân tích bất cứ lúc nào.
Giảm hiệu ứng silo (silo effect): Thông thường dữ liệu của doanh nghiệp bị phân tán trên nhiều nền tảng lưu trữ dữ liệu như Shopify, Google Analytics, Facebook, v.v. Tuy không thể có được toàn cảnh bức tranh lớn về hoạt động kinh doanh của công ty thông qua cách kết nối dữ liệu này, bởi vì nó tốn rất nhiều thời gian và công sức.
Chính vì vậy, để kết nối những dữ liệu này cần tốn nhiều thời gian và công sức và không thể phân tích bức tranh toàn cảnh hoạt động kinh doanh của công ty.
Công việc thu thập và đo lường dữ liệu từ các kênh rất khó khăn. Lưu trữ dữ liệu là đúng, nhưng nếu chỉ nhìn thấy một phần của dữ liệu tổng thể, nó chỉ hữu ích một phần cho doanh nghiệp. Vì vậy, kho dữ liệu hay Data warehouse làm giảm bớt khó khăn của hiệu ứng silo và giúp cho trực quan hóa các xu hướng qua bức tranh dữ liệu lớn.
Toàn quyền sở hữu dữ liệu: Khi lưu trữ dữ liệu phân tán nhiều kênh (silo effect), không thể hiện được hết insight về hoạt động kinh doanh của công ty. Một bất lợi khác là phải tuân theo chính sách lưu giữ dữ liệu của mọi nền tảng đang sử dụng. Nếu quyết định loại bỏ dữ liệu quan trọng nào thì đây sẽ là tổn thất lớn cho công ty.
Với kho dữ liệu riêng, mà có thể di chuyển và quản lý nguồn dữ liệu của doanh nghiệp. Nếu doanh nghiệp muốn sử dụng dữ liệu để thiết lập các mô hình dự đoán hành vi của khách hàng, doanh nghiệp có thể dựa vào lịch sử dữ liệu để phân tích và thực thi lưu trữ dữ liệu và chi phí.
Công ty sẽ phải chi trả một khoản chi phí để xây dựng kho dữ liệu bao gồm thiết lập nền móng cho kho dữ liệu, xây dựng các đường truyền dữ liệu vào kho kỹ thuật số mới.
Cách sử dụng kho dữ liệu thương mại điện tử hiệu quả:
Mô hình phân bổ
Mô hình phân bổ hay Attribute model có nghĩa là gắn các thẻ tag doanh số đến những nguồn dữ liệu phù hợp với các quy tắc do doanh nghiệp đề xuất. Chẳng hạn, doanh nghiệp chỉ định một phần hoặc toàn bộ tín dụng bán hàng (chỉ số doanh thu) cho từng nhân viên sale (trong phần dữ liệu nhân viên sale) trong quy trình bán hàng của mình.
Do đó, doanh nghiệp sẽ có một phép đo tỷ lệ hoàn vốn ROI nội bộ rõ ràng hơn với thông tin của từng nhân viên sale bán trên kênh bán hàng nào, ai mang đến doanh thu tốt nhất, v.v. Những thông tin này rất quan trọng trong môi trường kho dữ liệu thương mại điện tử lớn.
Phân tích dự đoán
Trong thương mại điện tử, phân tích dự đoán giúp ước tính doanh số bán hàng trong quý tới. Từ đó, xây dựng các đề xuất nội dung và sản phẩm thực tế, thiết thực cho các phân khúc khách hàng của doanh nghiệp.
Một nghiên cứu cho thấy rằng dự đoán tính điểm khách hàng tiềm năng rất quan trọng. Với khả năng cho điểm khách hàng tiềm năng, doanh nghiệp có thể dự đoán khách hàng tiềm năng nào có nhiều khả năng chuyển đổi thành khách hàng nhất. Điều này tạo ra đòn bẩy ngay lập tức trong tiếp thị: doanh nghiệp tiếp thị đúng khách hàng mục tiêu mà mình hướng đến, phân bổ chi phí hợp lý và ước tính được ROI thu được trên các chiến dịch tiếp thị. Ví dụ như Netflix: Trước khi công ty cho sản xuất một bộ phim, họ sẽ không ném tiền qua cửa sổ mà sử dụng phân tích dự đoán thông qua dữ liệu lịch sử để xác định loại chương trình mà khách hàng thực sự muốn.
Phân khúc khách hàng
Đây là bước cơ bản nhất trong kinh doanh được định nghĩa bởi nguyên tắc Pareto: một phần nhỏ khách hàng có khả năng có tác động lớn nhất đến lợi nhuận của doanh nghiệp.
Phân khúc khách hàng giúp doanh nghiệp dễ dàng hoạch định chiến lược và sử dụng nó làm lợi thế cạnh tranh cho công ty.
Thông thường, phân khúc khách hàng dựa trên các biến truyền thống như nhân khẩu học. Nhưng hiện nay, kho dữ liệu thương mại điện tử đã mở ra rất nhiều khả năng giúp xác định và phân biệt khách hàng. Chúng ta có thể dựa vào hành vi của họ như: sản phẩm đã mua, khả năng họ mở email quảng cáo và hành vi ghé thăm trước đó. Một số cửa hàng thương mại điện tử thậm chí còn đưa ra các khuyến nghị về thời tiết cụ thể dựa trên vị trí địa lý.
Tối ưu hóa chiến dịch quảng cáo và chi phí marketing
Khi có cái nhìn đúng đắn về các phân khúc khách hàng, doanh nghiệp sẽ có các mục tiêu chính xác hơn cho các quảng cáo trả phí. Với kho dữ liệu được kết nối các nguồn dữ liệu quảng cáo đổ về, doanh nghiệp sẽ thu hoạch được rất nhiều insight có giá trị, phát triển nhiều chiến dịch marketing hiệu quả hơn.
Ví dụ: Thử nghiệm phân tách A/B (A/B split testing) cho phép nhắm mục tiêu các biến khác nhau trong chiến dịch của mình. Điều này bao gồm lựa chọn kênh quảng cáo, thông điệp cấp cao high-level message, nhắm mục tiêu theo đối tượng và thậm chí là phiên bản sao lưu dùng trong chiến dịch quảng cáo. Những nguồn dữ liệu này khi được chuyển vào kho dữ liệu, doanh nghiệp sẽ có kết quả của mọi chiến dịch sẵn sàng để so sánh xem mức độ hiệu quả giữa chúng.
Khi đã sẵn sàng bắt đầu với kho dữ liệu thương mại điện tử của mình, đây là các bước doanh nghiệp cần thực hiện:
Xác định nguồn dữ liệu và số liệu muốn di chuyển
Trước khi chọn, cần phải biết dữ liệu đó là gì và nó phục vụ cho mục đích phân tích nào:
Nguồn dữ liệu và chỉ số (metric) đánh giá muốn di chuyển
Dữ liệu nào bắt buộc phải di dời vào kho dữ liệu
Việc di chuyển dữ liệu sẽ giúp ích gì cho hoạt động thương mại điện tử của các doanh nghiệp
Chọn điểm đến cho dữ liệu
Có thể lựa chọn kho dữ liệu đám mây từ nền tảng Supermetric hay các lựa chọn thuê ngoài outsource khác làm nơi lưu trữ dữ liệu. Và cũng cần xem xét yếu tố như khả năng tùy chọn phân tích và trình bày dữ liệu, hình ảnh trực quan để lựa chọn nền tảng chứa dữ liệu phù hợp nhất cho doanh nghiệp.
Mặt khác, marketer có thể bắt đầu xem xét điều kiện cơ sở hạ tầng phần cứng kỹ thuật công ty có thể đáp ứng và nền tảng dữ liệu thích hợp với mục tiêu kinh doanh của công ty.
Xác định nền tảng làm kho dữ liệu cho doanh nghiệp: Xác định mục tiêu lưu trữ dữ liệu. Nên tìm kiếm một nền tảng di chuyển dữ liệu đến doanh nghiệp của mình, tự động cập nhật dữ liệu đó vào vị trí giúp dễ dàng xem và truy cập bất kỳ lúc nào. Điều này cho phép doanh nghiệp truy cập liên tục vào dữ liệu mới, sạch. Dữ liệu đó hiện đã sẵn sàng để tiếp sức cho mọi khía cạnh của doanh nghiệp.
Chọn phương thức truyền dữ liệu
Cuối cùng, sẽ cần thiết lập phương thức truyền dữ liệu của mình thông qua nền tảng quản lý các đường truyền dữ liệu như Supermetrics, kết nối API tùy chỉnh tự phát triển hoặc thậm chí là kết nối API tùy chỉnh thuê ngoài. Chọn một phương pháp di chuyển dữ liệu an toàn, bảo mật với rủi ro tối thiểu trong quá trình di chuyển.
Với cơ sở hạ tầng đó, công ty bắt đầu thu hút dữ liệu từ các phương tiện truyền thông Đan Mạch trong tất cả các chiến dịch của mình. Họ ngay lập tức nhìn thấy tiềm năng mới trong insight mà dữ liệu cung cấp theo thời gian thực. Dữ liệu này mang đến những cơ hội mới khi cung cấp các báo cáo tổng hợp chéo từ nhiều kênh dữ liệu. Từ đó, doanh nghiệp thấy được những nỗ lực marketing nào đang có tác động nhiều nhất đến khách hàng tiềm năng./.