Skip to content

🐎 Applied Machine Learning (AML)


🌟 "Success is not an accident. It’s hard work, learning, and persistence."

🚀 "Start where you are. Use what you have. Do what you can."

Static Badge Static Badge Static Badge

I. Course Introduction


Mô tả. Applied Machine Learning (AML) được ghi chú và tổng hợp theo định dạng một khóa học, nhằm cung cấp cho người học cái nhìn tổng quan và toàn diện về lĩnh vực Machine Learning (ML) - từ lý thuyết cốt lõi đến thực hành triển khai. Toàn bộ nội dung tập trung vào các kỹ thuật và thuật toán nền tảng, giúp bạn nắm vững cách thức thu thập dữ liệu, tiền xử lý, và xây dựng các mô hình học máy một cách bài bản và có hệ thống. Khóa học không chỉ chú trọng vào kiến thức lý thuyết mà còn hướng dẫn người học từng bước triển khai, huấn luyện và đánh giá mô hình ML từ đầu đến cuối, qua các bài tập thực hành và dự án thực tế.

Đối tượng. Khóa học phù hợp với người mới bắt đầu làm quen với Trí tuệ Nhân tạo và Học máy. Ngoài ra, những người đã có kiến thức nền tảng cũng có thể sử dụng tài liệu này như một nguồn tham khảo hệ thống và thực tiễn.

Cấu trúc khóa học. Khóa học được tổng hợp và chia nhỏ thành 5 Module chính, xây dựng từ nền tảng lý thuyết cho đến thực hành triển khai toàn bộ hệ thống ML trong thực tế. Cụ thể:

  • Module 01. Introduction to ML & Development Environment (Tổng quan về Học máy và Môi trường phát triển)
  • Module 02. Data Preprocessing & Exploratory Data Analysis (Tiền xử lý và Khám phá dữ liệu)
  • Module 03. Supervised Learning Algorithms (Các thuật toán học có giám sát)
  • Module 04. Unsupervised Learning Algorithms (Các thuật toán học không giám sát)
  • Module 05: ML Pipelines & Deployment (Đường ống ML và Triển khai hệ thống)

Chi tiết nội dung bài học của từng Module được mô tả chi tiết trong [syllabus]

Liên kết nhanh: Toàn bộ nội dung khóa học bao gồm ghi chú bài học (notes), mã chương trình (code) và tài liệu tham khảo (materials) được tổng hợp và có thể truy cập nhanh tại những địa chỉ sau:

II. What will you learn?


Sau khi đọc xong toàn bộ khóa học này, bạn có thể thu thập được những tri thức dưới đây:

  • Nắm vững các thuật toán học máy cơ bản như Linear Regression, Support Vector Machine, Decision Trees, K-mean Clustering, v.v.

  • Thành thạo quy trình xây dựng mô hình ML từ dữ liệu thô đến đánh giá kết quả.

  • Hiểu và áp dụng kỹ thuật thu thập, tiền xử lý và trực quan hóa dữ liệu.

  • Thực hành triển khai mô hình bằng Python và các thư viện như: Scikit-learn, Numpy, Pandas, Matplotlib, Seaborn, v.v.

  • Áp dụng mô hình vào các bài toán thực tế qua mini-projects và case studies.

III. Requirements


Để có thể tiếp cận nội dung của toàn bộ khóa học một cách dễ dàng, người đọc cần có sẵn một số kiến thức nền tảng như:

  • Lập trình Python cơ bản: Thành thạo các cấu trúc dữ liệu cơ bản, vòng lặp, hàm và thao tác xử lý dữ liệu với thư viện như numpy và pandas.

  • Toán học nền tảng: Có kiến thức cơ bản về đại số tuyến tính, giải thích và xác suất thống kê.

  • Kỹ năng tự học và giải quyết vấn đề: Sẵn sàng tiếp cận tài liệu học thuật, nghiên cứu thuật toán, và thử nghiệm mô hình trong môi trường thực tế.

IV. Syllabus


Module Topic Content & Key Concepts
Module 01
Overview & Environment
Lecture 01. Introduction to ML
[notes] [code]
  • Định nghĩa & Phân loại: Supervised, Unsupervised, RL
  • Thách thức trong triển khai thực tế
  • Quy trình phát triển dự án ML chuẩn
Lecture 02. ML Development Roadmap
  • Vòng đời phát triển (ML Lifecycle)
  • Các yếu tố cốt lõi: Data, Model, Compute
  • Giới thiệu về MLOps cơ bản
Lecture 03. Python for Data Science
  • Thiết lập môi trường: Anaconda, Jupyter, Colab
  • Hệ sinh thái: NumPy (Đại số), Pandas (Dữ liệu), Matplotlib (Vẽ biểu đồ)
Module 02
Preprocessing & EDA
Lecture 04. Data Preprocessing Strategy
  • Tầm quan trọng của tiền xử lý
  • Các chiến lược làm sạch và chuẩn hóa dữ liệu
  • Xử lý dữ liệu mất cân bằng (Imbalanced Data)
Lecture 05. Cleaning & Missing Values
  • Phát hiện và xử lý Outlier (Ngoại lai)
  • Kỹ thuật Imputation (Điền khuyết thiếu)
  • Làm sạch dữ liệu trùng lặp
Lecture 06. Feature Engineering
  • Feature Selection (RFE, Feature Importance)
  • Feature Transformation (Scaling, Encoding)
  • Dimensionality Reduction cơ bản
Module 03
Supervised Learning
Lecture 07. Linear Models
  • Linear Regression & Logistic Regression
  • Gradient Descent & Normal Equation
  • Regularization: Ridge, Lasso, Elastic Net
Lecture 08. Support Vector Machines
  • Nguyên lý biên cứng (Hard Margin) & biên mềm (Soft Margin)
  • Kernel Trick & bài toán phi tuyến
Lecture 09. Tree-based Models
  • Cấu trúc Decision Tree (CART, ID3)
  • Ensemble Learning: Random Forest, Gradient Boosting
  • Overfitting & Pruning Strategies
Module 04
Unsupervised Learning
Lecture 10. Clustering Algorithms
  • Phân cụm K-means & K-medoids
  • Phân cụm mật độ (DBSCAN)
  • Đánh giá hiệu quả phân cụm (Silhouette Score)
Lecture 11. Dimensionality Reduction
  • Principal Component Analysis (PCA)
  • t-SNE & Manifold Learning
Module 05
Pipelines & Deployment
Lecture 12. Model Evaluation & Tuning
  • Cross-Validation (K-Fold, Stratified)
  • Hyperparameter Tuning (GridSearch, RandomSearch)
  • Metrics: Accuracy, Precision, Recall, F1-Score, ROC-AUC
Lecture 13. ML Pipelines & Deployment
  • Xây dựng Pipeline với Scikit-learn
  • Lưu trữ mô hình (Pickle, Joblib)
  • Chiến lược triển khai cơ bản (API Serving)

V. Materials