Những lỗi sai kinh điển khi mới sử dụng SQL

Công cụ chỉ giúp các Data Analyst giải quyết câu hỏi How, trong khi để thực sự giải quyết vấn đề Why chúng ta cần đến Mindset. Chính vì thế, trong thời gian đầu sử dụng SQL hay các bạn fresher DA thường mắc phải khá nhiều lỗi mà mình gọi là “kinh điển”.

1. Không nắm được Order of execution

Thứ tự thực thi câu lệnh – order of execution

Khi bắt đầu học tập tành query dữ liệu, chúng ta phải nắm thuộc lòng thứ tự các câu lệnh, như cách mà chúng ta học ngữ pháp tiếng Anh. Một câu query sẽ theo thứ tự như sau: (1) SELECT -> (2) FROM -> (3) WHERE … Nhưng còn một khái niệm ít được nhắc tới là thứ tự thực thi câu lệnh – order of execution. Máy tính sẽ chạy phần FROM (JOIN nếu có) trước để lấy data từ bảng vào, sau đó sẽ dùng WHERE để filter những data cần xử lý rồi tới bước GROUP BY & HAVING (nếu có), và sau đó là SELECT, lấy ra những field chúng ta muốn. Bên cạnh đó, còn những bước xử lý sau đó nếu câu query có ORDER BY hay LIMIT. Nắm được khái niệm này sẽ giúp chúng ta optimize câu query tốt hơn khi gặp request lớn.

2. Không define chính xác các metric và measure với stakeholder khi nhận request

Nhận request mơ hồ là câu chuyện thường xuyên

Đôi lúc, stakeholder sẽ đưa cho bạn các request khá mơ hồ như “Cho anh số liệu doanh thu tháng vừa rồi theo tháng, tuần”. Các bạn Fresher thường mắc sai lầm khi lao ngay vào lấy số liệu của stakeholder yêu cầu, mà không dừng lại phân tích rõ yêu cầu, hay thậm chí là “challenge” lại request đấy, để có thể đưa thêm những góc nhìn khác cho stakeholder. Điều này khiến cho các Fresher DA rơi vào thế bị động, và có thể phải chỉnh sửa báo cáo nhiều lần, nếu có yêu cầu mới phát sinh. Ví dụ như về thời gian, chúng ta sẽ lấy theo thời gian thanh toán thành công, hay thời gian giao hàng thành công, doanh thu có bao gồm cả những đơn hàng đã hoàn trả hay không. Và nếu stakeholder muốn xem thêm tỉ lệ của các phương thức thanh toán hoặc yếu tố khác thì chúng ta sẽ phải làm như thế nào. Vì vậy, việc define những thông tin ban đầu là rất quan trọng, nếu không, chúng ta sẽ mất rất nhiều thời gian chỉnh sửa báo cáo.

3. “Quên” chuyển hóa data thành insights

Đọc thần chú “Chuyển data thành insight” 🙂

Một thiếu sót nữa của các bạn Fresher hay ngay cả mình ở thời gian đầu chính là cung cấp 1 report không có insight. Mình có 1 ví dụ trong eCommerce, với stakeholder hoặc các cấp quản lý, bên cạnh việc muốn xem số liệu doanh thu, họ còn muốn biết được ngành hàng nào đang chiếm tỉ trọng lớn nhất, hoặc phương thức thanh toán nào đang được dùng nhiều nhất… Hoặc ngành hàng họ đang quan tâm đang đứng thứ mấy trong tỷ trọng doanh thu. Lấy được valuable data đã khó, vì vậy bạn hãy cố gắng biến chúng thành những insight có giá trị.

4. Thiếu Domain knowledge

Hiểu biết về ngành/lĩnh vực hỗ trợ quá trình tìm ra insight

Hiện nay, một yếu tố rất được chú trọng khi các công ty lớn tuyển Data Analyst chính là domain knowledge nhưng các Fresher DA đôi khi phớt lờ yếu tố này. Nếu dạo quanh các trang tuyển dụng, bạn sẽ thấy những ngân hàng, công ty kiểm toán hay bảo hiểm tuyển DA thường yêu cầu có kinh nghiệm 3-5 năm. Vậy phải làm thế nào để Fresher DA có đủ kĩ năng & kiến thức để cạnh tranh với những bạn có kinh nghiệm? Cách duy nhất là ngoài phát triển technical skills, bạn nên bồi dưỡng thêm kiến thức về domain knowledge của mảng bạn đang làm.

5. Thiếu Business knowledge

Kiến thức business là một yếu tố rất quan trongk

Bạn phải hiểu business, cũng như cấu trúc dữ liệu và hệ thống dữ liệu của công ty. Biết việc gì có thể/không thể làm được, việc gì sẽ mất nhiều thời gian để thực hiện, việc gì chỉ là thay đổi nhỏ. Ví dụ, đối với một trang thương mại điện tử thì từ lúc khách hàng lựa chọn hàng hóa cho đến lúc mua trải qua rất nhiều bước, các bước này đều được ghi nhận vào hệ thống. Nếu không hiểu rõ cách tracking và record các bước này trên hệ thống, bạn có thể nhầm hoặc bỏ sót một vài điều kiện trong cách export dữ liệu. Điều này có thể dẫn đến nhầm lẫn giữa số lượng khách hàng đang chọn lựa, với số lượng khách hàng đã mua hàng. Và dĩ nhiên, nó sẽ ảnh hưởng rất lớn đến phân tích/báo cáo của bạn.

Hy vọng bài viết trên có thể cung cấp thêm cho các Fresher Data Analyst những thông tin bổ ích giúp các bạn sớm vượt qua những rào cản khi gia nhập ngành Data nhé!

Xem Infographic Những lỗi sai kinh điển khi mới sử dụng SQL

Các kênh thông tin của Vinh:

Share để lưu bài viết

One Comment

Leave a Reply

Your email address will not be published. Required fields are marked *