Skip to content

🐎 Applied Machine Learning (AML)


🌟 "Success is not an accident. It’s hard work, learning, and persistence."

🚀 "Start where you are. Use what you have. Do what you can."

Static Badge Static Badge Static Badge

Course Introduction


Mô tả. Applied Machine Learning (AML) được ghi chú và tổng hợp theo định dạng một khóa học, nhằm cung cấp cho người học cái nhìn tổng quan và toàn diện về lĩnh vực Machine Learning (ML) - từ lý thuyết cốt lõi đến thực hành triển khai. Toàn bộ nội dung tập trung vào các kỹ thuật và thuật toán nền tảng, giúp bạn nắm vững cách thức thu thập dữ liệu, tiền xử lý, và xây dựng các mô hình học máy một cách bài bản và có hệ thống. Khóa học không chỉ chú trọng vào kiến thức lý thuyết mà còn hướng dẫn người học từng bước triển khai, huấn luyện và đánh giá mô hình ML từ đầu đến cuối, qua các bài tập thực hành và dự án thực tế.

Đối tượng. Khóa học phù hợp với người mới bắt đầu làm quen với Trí tuệ Nhân tạo và Học máy. Ngoài ra, những người đã có kiến thức nền tảng cũng có thể sử dụng tài liệu này như một nguồn tham khảo hệ thống và thực tiễn.

Cấu trúc khóa học. Khóa học được tổng hợp và chia nhỏ thành 5 Module chính - từ nền tảng lý thuyết cho đến thực hành triển khai toàn bộ hệ thống ML trong thực tế. Cụ thể:

  • Module 01. Introduction to ML & Development Environment (Tổng quan về Học máy và Môi trường phát triển)
  • Module 02. Data Preprocessing & Exploratory Data Analysis (Tiền xử lý và Khám phá dữ liệu)
  • Module 03. Supervised Learning Algorithms (Các thuật toán học có giám sát)
  • Module 04. Unsupervised Learning Algorithms (Các thuật toán học không giám sát)
  • Module 5: ML Pipelines & Deployment (Đường ống ML và Triển khai hệ thống)

Chi tiết nội dung bài học của từng Module được mô tả chi tiết trong [syllabus]

Liên kết nhanh: Toàn bộ nội dung khóa học bao gồm ghi chú bài học (notes), mã chương trình (code) và tài liệu tham khảo (materials) được tổng hợp và có thể truy cập nhanh tại những địa chỉ sau:

What will you learn?


Sau khi đọc xong toàn bộ khóa học này, bạn có thể thu thập được những tri thức dưới đây:

  • Nắm vững các thuật toán học máy cơ bản như Linear Regression, Support Vector Machine, Decision Trees, K-mean Clustering,v.v.

  • Thành thạo quy trình xây dựng mô hình ML từ dữ liệu thô đến đánh giá kết quả.

  • Hiểu và áp dụng kỹ thuật thu thập, tiền xử lý và trực quan hóa dữ liệu.

  • Thực hành triển khai mô hình bằng Python và các thư viện như: Scikit-learn, Numpy, Pandas, Matplotlib, Seaborn,v.v.

  • Áp dụng mô hình vào các bài toán thực tế qua mini-projects và case studies.

Requirements


Để có thể tiếp cận nội dung của toàn bộ khóa học một cách dễ dàng, người đọc cần có sẵn một số kiến thức nền tảng như:

  • Lập trình Python cơ bản: Thành thạo các cấu trúc dữ liệu cơ bản, vòng lặp, hàm và thao tác xử lý dữ liệu với thư viện như numpy và pandas.

  • Toán học nền tảng: Có kiến thức cơ bản về đại số tuyến tính, giải thích và xác suất thống kê.

  • Kỹ năng tự học và giải quyết vấn đề: Sẵn sàng tiếp cận tài liệu học thuật, nghiên cứu thuật toán, và thử nghiệm mô hình trong môi trường thực tế.

Syllabus


Dealine Module Lecture Description
Module 01. Introduction to ML & Development Environment Lecture 01. Overview to Machine Learning
theory
[notes] [code]
  • Khái niệm & vai trò thực tiễn
  • Phân loại: Giám sát; Không giám sát; Tăng cường
  • Thách thức triển khai mô hình
  • Lecture 02. Roadmap for Building ML Systems
    theory
  • Các bước xây dựng hệ thống
  • Yếu tố ảnh hưởng: dữ liệu, mô hình, hiệu năng
  • MLOps & vòng đời mô hình
  • Lecture 03. Using Python & ML Libraries
    practice
  • Python cho khoa học dữ liệu
  • Jupyter, Anaconda, Colab
  • Thư viện cơ bản: NumPy, pandas, matplotlib, scikit-learn
  • Module 02. Data Preprocessing & Exploratory Data Analysis Lecture 04. Essential Concepts in Data Preprocessing
  • Vai trò tiền xử lý
  • Kỹ thuật: làm sạch; chọn; biến; tạo đặc trưng
  • Lựa chọn phù hợp & lỗi thường gặp
  • Lecture 05. Data Cleaning & Missing Value Handling
  • Vai trò làm sạch dữ liệu
  • Xử lý dư thừa, trùng lặp, ngoại lệ
  • Chiến lược xử lý giá trị thiếu
  • Lecture 06. Feature Selection Techniques
  • Lợi ích chọn đặc trưng
  • So sánh các phương pháp
  • Thực hành RFE & tinh chỉnh
  • Đánh giá hiệu quả mô hình
  • Lecture 07. Data Transformation Techniques
  • Kỹ thuật biến đổi dữ liệu
  • Chuẩn hóa, rời rạc hóa, xử lý ngoại lệ
  • Mã hóa & biến đổi phân phối
  • Tạo đặc trưng mới
  • Module 03. Supervised Learning Algorithms Lecture 08. Linear Models in Machine Learning
  • Linear & Logistic Regression
  • Gradient Descent, Normal Equation
  • Regularization: Ridge, Lasso, Elastic Net
  • Softmax Regression cho phân loại đa lớp
  • Lecture 09. Support Vector Machines
  • Linear SVM: Hard vs. Soft Margin
  • Kernel Trick cho bài toán phi tuyến
  • Polynomial & Gaussian RBF Kernel
  • Bài toán đối ngẫu (Dual Problem)
  • Lecture 10. Decision Trees
  • Cấu trúc và trực quan hóa cây
  • CART & độ phức tạp huấn luyện
  • Gini vs. Entropy
  • Siêu tham số & kiểm soát overfitting
  • Hồi quy & phân loại với cây quyết định
  • Lecture 11. Ensemble Learning & Random Forests
  • Nguyên lý học tổ hợp (Voting, Averaging)
  • Bagging, Pasting & OOB Evaluation
  • Random Forest & Extra-Trees
  • Feature Importance từ cây ngẫu nhiên
  • Boosting: AdaBoost, Gradient Boosting
  • Stacking & kỹ thuật kết hợp mô hình
  • Lecture 12. Dimensionality Reduction & Latent Variables
  • Hiểu lời nguyền chiều (Curse of Dimensionality)
  • PCA: tối đa phương sai, tối thiểu lỗi
  • Probabilistic PCA & Factor Analysis
  • Kernel PCA & nonlinear manifold learning
  • ICA, Autoencoder & latent representations
  • Module 04. Unsupervised Learning Algorithms Lecture 13. Clustering & Unsupervised Pattern Discovery
  • K-means và giới hạn của nó
  • DBSCAN và các thuật toán khác
  • Chọn số cụm tối ưu, Semi-supervised clustering
  • Lecture 14. Mixture Models & Expectation Maximization
  • Gaussian Mixture Models (GMM)
  • Maximum Likelihood cho mixture models
  • Thuật toán EM: nguyên lý và trực quan
  • Mixtures of Bernoulli, Bayesian linear regression
  • Module 5: ML Pipelines & Deployment Lecture 15: Pipelines & Hyperparameter Tuning
  • scikit-learn pipelines
  • Cross-validation
  • GridSearchCV; RandomizedSearchCV
  • Feature selection tích hợp
  • Đánh giá & tối ưu mô hình
  • Lecture 16. Model Deployment & Inference Optimization
  • Hiểu lầm phổ biến khi triển khai
  • Batch vs Online prediction
  • Kết hợp batch và streaming pipeline
  • Tối ưu mô hình: pruning, quantization, distillation
  • Materials


    phần này tổng Phần này tổng hợp toàn bộ tài liệu được sử dụng trong suốt khóa học, tài liệu đọc thêm và liên kết tham khảo. Ngoài ra, bạn cũng sẽ tìm thấy các nguồn học tập mở rộng giúp củng cố và đào sâu kiến thức.

    Lecture 01. Overview to Machine Learning: