Machine learning (ML hay học máy) là một phạm trù trong thuật toán, cho phép các ứng dụng phần mềm dự đoán kết quả chính xác hơn mà không cần lập trình trực tiếp. Tiên đề của machine learning là xây dựng thuật toán có thể nhận thông tin và sử dụng các phân tích thống kê để dự đoán kết quả, đồng thời cập nhật kết quả khi có dữ liệu mới.
Machine Learning là gì?
Machine learning (ML) hay còn gọi là học máy, là một phần của trí tuệ nhân tạo (AI) dựa trên nghiên cứu máy tính có khả năng cải thiện chính bản thân chúng thông qua việc sử dụng dữ liệu mẫu (training data) hoặc kinh nghiệm đã học. Machine learning có khả năng tự đoán hoặc đưa ra quyết định mà không cần phải được lập trình cụ thể.
Có hai loại chính của machine learning: dự đoán (prediction) và phân loại (classification). Các bài toán dự đoán như dự đoán giá nhà hoặc giá xe, trong khi các bài toán phân loại liên quan đến việc nhận diện chữ viết tay hoặc đồ vật, ví dụ như nhận diện đối tượng từ hình ảnh.
- Dataset (Bộ dữ liệu): Đây là tập dữ liệu nguyên thủy, chưa qua xử lý, thu thập bởi lập trình viên ở bước đầu tiên trong quá trình thu thập dữ liệu.
- Data point (Điểm dữ liệu): Đây là một phần của Dataset, biểu thị một quan sát cụ thể. Mỗi data point có nhiều thuộc tính hoặc đặc trưng khác nhau. Data point thường được biểu diễn dưới dạng hàng trong bảng dữ liệu, mỗi hàng có thể chứa một hoặc nhiều đặc trưng dữ liệu.
- Training data (Dữ liệu học) và Test data (Dữ liệu kiểm tra): Training data được sử dụng để huấn luyện mô hình máy học, trong khi Test data được sử dụng để đánh giá mô hình. Thường, tỷ lệ phân chia giữa hai loại dữ liệu này là 80% cho training data và 20% cho test data.
- Model (Mô hình): Mô hình là kết quả của quá trình huấn luyện trên dữ liệu học. Mô hình sẽ sử dụng thuật toán để đưa ra dự đoán hoặc quyết định dựa trên kiến thức mà nó đã học từ training data.
Việc sử dụng machine learning giúp dự đoán và phân tích dữ liệu với độ chính xác cao hơn, đặc biệt hữu ích khi có lượng lớn dữ liệu cần xử lý. Machine learning giúp giảm bớt công việc và sai sót của con người, có rất nhiều ứng dụng của machine learning trong đời sống hiện đại như:
Machine learning gồm hai loại chính:
- Supervised learning (Học có giám sát): Trong học có giám sát, máy tính học trên dữ liệu đã được gán nhãn (label), có nghĩa là mỗi điểm dữ liệu đầu vào (Xi) có một nhãn tương ứng (Yi).
- Unsupervised learning (Học không giám sát): Trong học không giám sát, máy tính học từ dữ liệu mà không có thông tin nhãn. Các thuật toán sẽ tự tìm hiểu sự tương quan trong dữ liệu, tạo mô hình cho dữ liệu, hoặc giúp máy tính giảm số chiều của dữ liệu.
Ngoài ra, machine learning cũng được phân thành các loại khác như:
- Semi-supervised learning (Học bán giám sát): Kết hợp giữa học có giám sát và học không giám sát.
- Deep learning (Học sâu): Liên quan đến việc sử dụng mạng neuron nhiều lớp để giải quyết các vấn đề phức tạp.
- Reinforcement learning (Học củng cố/tăng cường): Máy tính học thông qua thử nghiệm và lỗi lầm, thường được sử dụng trong việc đưa ra quyết định liên tục trong môi trường thay đổi.
Mặc dù thuật toán machine learning đã xuất hiện được vài thập kỉ nhưng nó chỉ trở nên phổ biến khi trí tuệ nhân tạo (AI) phát triển. Các mô hình "deep learning" góp mặt trong hầu hết các ứng dụng AI tiên tiến hiện nay.
Nền tảng machine learning là một trong những lĩnh vực cạnh tranh nhất của các công ty công nghệ như Amazon, Google, Microsoft, IBM, .... Các công ty này chạy đua để tranh giành khách hàng đăng kí cho các dịch vụ nền tảng bao trùm các hoạt động machine learning, như thu thập dữ liệu, tiền xử lý dữ liệu, xây dựng mô hình, triển khai ứng dụng và đào tạo. Khi tầm quan trọng của machine learning và AI trong thành lập và quản lý doanh nghiệp ngày càng tăng thì cuộc chiến nền tảng machine learning sẽ ngày càng cam go hơn.
Nghiên cứu chuyên sâu về deep learning và AI sẽ tập trung vào phát triển các ứng dụng chung. Mô hình AI ngày nay đòi hỏi phải có kiến thức chuyên sâu để đưa ra những thuật toán tối ưu nhất. Nhưng các nhà khoa học đang tìm ra phương pháp để làm cho các mô hình linh hoạt hơn, có thể áp dụng những kiến thức học được từ một mô hình vào mô hình khác trong tương lai. Sau khi đọc bài viết này tại Taimienphi.vn, hy vọng bạn đọc sẽ có thêm những kiến thức bổ ích về phạm trù thuật toán này và có thể ứng dụng nó vào công việc một cách hiệu quả nhất.