4 tựa sách Python không thể bỏ qua nếu bạn là dân data

4 cuốn sách học python

Trong bài viết “Sử dụng tốt Python có là lợi thế cạnh tranh của Data Analyst? , các bạn đã thấy được mức độ phổ biến của Python trong ngành khoa học dữ liệu. Do có cộng đồng người sử dụng rộng rãi khắp thế giới và khả năng thực thi tác vụ thuộc nhiều ngành khác nhau, các nguồn tài liệu dành cho người học Python cũng vô cùng đa dạng và đôi lúc khiến chúng ta choáng ngợp. Vì vây, trong bài viết này, Vinh sẽ giới thiệu 4 tựa sách được xem là phù hợp với những người muốn áp dụng Python vào công việc phân tích dữ liệu.

1. Python Crash Course, 2nd Edition: A Hands-On, Project-Based Introduction to Programming – Eric Matthes 

Python Crash Course, 2nd Edition: A Hands-On, Project-Based Introduction to Programming - Eric Matthes 

Đây là tựa sách cực kỳ phù hợp nếu bạn đang là một Python beginner. Cuốn sách giới thiệu đầy đủ các khái niệm cơ bản trong Python như biến, hàm, lớp, vòng lặp, điều kiện và các loại dữ liệu cùng ví dụ trực quan để minh họa. Bên cạnh đó, bạn cũng được tìm hiểu các project, nơi áp dụng các thư viện, module khác nhau để tạo ra một chương trình hoàn chỉnh. Python Crash Course được trang web realpython.com xếp hạng đầu tiên trong danh sách những cuốn sách hay nhất dành cho học Python.

Link (for resources in the book): https://ehmatthes.github.io/pcc_2e/regular_index/

2. Python for Data Analysis: Data Wrangling with Pandas, Numpy, and IPython – Wes McKinney 

Python for Data Analysis: Data Wrangling with Pandas, Numpy, and IPython - Wes McKinney 

Đúng như tên gọi, cuốn sách này cung cấp đầy đủ kiến thức cũng như rất nhiều ví dụ dễ hiểu để bạn đọc và thực hành phân tích dữ liệu với các thư viện pandas và numpy. Đặc biệt, tác giả Wes McKinney chính là người tạo ra thư viện pandas, nên cuốn sách được trình bày rất dễ hiểu ngay cả với những người chỉ mới bắt đầu làm quen với Python. Các tài liệu hay file dữ liệu được dùng trong sách có sẵn trên GitHub, bạn có thể tải xuống và thực hành bất cứ lúc nào.

Link: https://wesmckinney.com/book/

3. Python Data Science Handbook – Jake VanderPlas

Python Data Science Handbook - Jake VanderPlas

Thêm một tựa sách tập trung vào các module dùng cho phân tích dữ liệu. Tuy nhiên, không chỉ có các thư viện cơ bản như pandas hay numpy, cuốn sách này còn giới thiệu khá sâu về trực quan hóa dữ liệu với matplotlib và seaborn, cũng như thư viện scikit-learn và các mô hình thuật toán cơ bản trong machine learning. Các ví dụ trong sách cũng có thể dễ dàng tìm và theo dõi trên GitHub.

Link: https://jakevdp.github.io/PythonDataScienceHandbook/

4. Automate the Boring Stuff with Python, 2nd Edition: Practical Programming for Total Beginners – Al Sweigart

Automate the Boring Stuff with Python, 2nd Edition: Practical Programming for Total Beginners - Al Sweigart

Khác với những cuốn sách trên, Automate the Boring Stuff with Python tập trung giải quyết bài toán tối ưu hóa quy trình làm việc. Cuốn sách đi sâu vào các tác vụ đơn giản nhưng lặp đi lặp lại, dùng ngôn ngữ lập trình để tự động hóa các quy trình đó, rút ngắn thời gian đồng thời đảm bảo độ chính xác gần như tuyệt đối, giúp chúng ta tiết kiệm nhiều giờ đồng hồ làm việc để tập trung giải quyết các mục tiêu quan trọng khác. Sau một thời gian thiết lập các chương trình, chứng kiến các đầu việc nhàm chán từng lấy đi vài ngày trong quỹ thời gian, giờ đây được hoàn thành chỉ trong vài giờ, thậm chí vài phút, rõ ràng giúp hiệu suất cũng như tâm trạng làm việc của bạn tốt lên rất nhiều.

Link: https://automatetheboringstuff.com/

Trên đây là những cuốn sách rất bổ ích về Python dành cho người làm trong ngành dữ liệu mà bạn có thể tìm đọc. Hy vọng bạn sẽ học được nhiều điều thú vị từ các tựa sách trên để áp dụng vào công việc của mình.

Share để lưu bài viết

Leave a Reply

Your email address will not be published. Required fields are marked *