🐎 Applied Machine Learning (AML)

🌟 "Success is not an accident. It’s hard work, learning, and persistence."

🚀 "Start where you are. Use what you have. Do what you can."

I. Course Introduction

Mô tả. Applied Machine Learning (AML) được ghi chú và tổng hợp theo định dạng một khóa học, nhằm cung cấp cho người học cái nhìn tổng quan và toàn diện về lĩnh vực Machine Learning (ML) - từ lý thuyết cốt lõi đến thực hành triển khai. Toàn bộ nội dung tập trung vào các kỹ thuật và thuật toán nền tảng, giúp bạn nắm vững cách thức thu thập dữ liệu, tiền xử lý, và xây dựng các mô hình học máy một cách bài bản và có hệ thống. Khóa học không chỉ chú trọng vào kiến thức lý thuyết mà còn hướng dẫn người học từng bước triển khai, huấn luyện và đánh giá mô hình ML từ đầu đến cuối, qua các bài tập thực hành và dự án thực tế.

Đối tượng. Khóa học phù hợp với người mới bắt đầu làm quen với Trí tuệ Nhân tạo và Học máy. Ngoài ra, những người đã có kiến thức nền tảng cũng có thể sử dụng tài liệu này như một nguồn tham khảo hệ thống và thực tiễn.

Cấu trúc khóa học. Khóa học được tổng hợp và chia nhỏ thành 5 Module chính, xây dựng từ nền tảng lý thuyết cho đến thực hành triển khai toàn bộ hệ thống ML trong thực tế. Cụ thể:

Module 01. Introduction to ML & Development Environment (Tổng quan về Học máy và Môi trường phát triển)
Module 02. Data Preprocessing & Exploratory Data Analysis (Tiền xử lý và Khám phá dữ liệu)
Module 03. Supervised Learning Algorithms (Các thuật toán học có giám sát)
Module 04. Unsupervised Learning Algorithms (Các thuật toán học không giám sát)
Module 05: ML Pipelines & Deployment (Đường ống ML và Triển khai hệ thống)

Chi tiết nội dung bài học của từng Module được mô tả chi tiết trong [syllabus]

Liên kết nhanh: Toàn bộ nội dung khóa học bao gồm ghi chú bài học (notes), mã chương trình (code) và tài liệu tham khảo (materials) được tổng hợp và có thể truy cập nhanh tại những địa chỉ sau:

II. What will you learn?

Sau khi đọc xong toàn bộ khóa học này, bạn có thể thu thập được những tri thức dưới đây:

Nắm vững các thuật toán học máy cơ bản như Linear Regression, Support Vector Machine, Decision Trees, K-mean Clustering, v.v.
Thành thạo quy trình xây dựng mô hình ML từ dữ liệu thô đến đánh giá kết quả.
Hiểu và áp dụng kỹ thuật thu thập, tiền xử lý và trực quan hóa dữ liệu.
Thực hành triển khai mô hình bằng Python và các thư viện như: Scikit-learn, Numpy, Pandas, Matplotlib, Seaborn, v.v.
Áp dụng mô hình vào các bài toán thực tế qua mini-projects và case studies.

III. Requirements

Để có thể tiếp cận nội dung của toàn bộ khóa học một cách dễ dàng, người đọc cần có sẵn một số kiến thức nền tảng như:

Lập trình Python cơ bản: Thành thạo các cấu trúc dữ liệu cơ bản, vòng lặp, hàm và thao tác xử lý dữ liệu với thư viện như numpy và pandas.
Toán học nền tảng: Có kiến thức cơ bản về đại số tuyến tính, giải thích và xác suất thống kê.
Kỹ năng tự học và giải quyết vấn đề: Sẵn sàng tiếp cận tài liệu học thuật, nghiên cứu thuật toán, và thử nghiệm mô hình trong môi trường thực tế.

IV. Syllabus

Module	Topic	Content & Key Concepts
Module 01 Overview & Environment	Lecture 01. Introduction to ML [notes] [code]	Định nghĩa & Phân loại: Supervised, Unsupervised, RL Thách thức trong triển khai thực tế Quy trình phát triển dự án ML chuẩn
	Lecture 02. ML Development Roadmap	Vòng đời phát triển (ML Lifecycle) Các yếu tố cốt lõi: Data, Model, Compute Giới thiệu về MLOps cơ bản
	Lecture 03. Python for Data Science	Thiết lập môi trường: Anaconda, Jupyter, Colab Hệ sinh thái: NumPy (Đại số), Pandas (Dữ liệu), Matplotlib (Vẽ biểu đồ)

Module 02 Preprocessing & EDA	Lecture 04. Data Preprocessing Strategy	Tầm quan trọng của tiền xử lý Các chiến lược làm sạch và chuẩn hóa dữ liệu Xử lý dữ liệu mất cân bằng (Imbalanced Data)
	Lecture 05. Cleaning & Missing Values	Phát hiện và xử lý Outlier (Ngoại lai) Kỹ thuật Imputation (Điền khuyết thiếu) Làm sạch dữ liệu trùng lặp
	Lecture 06. Feature Engineering	Feature Selection (RFE, Feature Importance) Feature Transformation (Scaling, Encoding) Dimensionality Reduction cơ bản

Module 03 Supervised Learning	Lecture 07. Linear Models	Linear Regression & Logistic Regression Gradient Descent & Normal Equation Regularization: Ridge, Lasso, Elastic Net
	Lecture 08. Support Vector Machines	Nguyên lý biên cứng (Hard Margin) & biên mềm (Soft Margin) Kernel Trick & bài toán phi tuyến
	Lecture 09. Tree-based Models	Cấu trúc Decision Tree (CART, ID3) Ensemble Learning: Random Forest, Gradient Boosting Overfitting & Pruning Strategies

Module 04 Unsupervised Learning	Lecture 10. Clustering Algorithms	Phân cụm K-means & K-medoids Phân cụm mật độ (DBSCAN) Đánh giá hiệu quả phân cụm (Silhouette Score)
	Lecture 11. Dimensionality Reduction	Principal Component Analysis (PCA) t-SNE & Manifold Learning

Module 05 Pipelines & Deployment	Lecture 12. Model Evaluation & Tuning	Cross-Validation (K-Fold, Stratified) Hyperparameter Tuning (GridSearch, RandomSearch) Metrics: Accuracy, Precision, Recall, F1-Score, ROC-AUC
	Lecture 13. ML Pipelines & Deployment	Xây dựng Pipeline với Scikit-learn Lưu trữ mô hình (Pickle, Joblib) Chiến lược triển khai cơ bản (API Serving)

🐎 Applied Machine Learning (AML)

I. Course Introduction

II. What will you learn?

III. Requirements

IV. Syllabus

V. Materials