Học máy là gì và cách hiểu về nó?

Học máy (machine learning), hay còn gọi là máy học là một thuật ngữ được giới công nghệ được nhắc đến khá nhiều trong thời gian gần đây. Nói nôm na, học máy có nghĩa là việc chúng ta "dạy" cho máy móc biết tự học hỏi và cập nhật kiến thức, để chúng ngày càng trở nên thông minh hơn.
Trước nay, máy móc là những thiết bị do con người tạo ra để phục vụ một mục đích/công việc nào đó, hay một công đoạn cụ thể nào đó trong một quy trình sản xuất, giúp tăng năng suất lao động, kể cả việc thay thế cho con người trong những điều kiện làm việc khắc nghiệt và nguy hiểm. Về cơ bản, các máy móc này được lập trình sẵn để chúng "cứ thế mà làm" (hoạt động), và chỉ thay đổi quy trình hoạt động (tức cách chúng làm việc) khi chúng ta thay đổi "não bộ" - chương trình hoạt động, cho chúng mà thôi.
 
Ý tưởng về học máy đã bắt đầu xuất hiện ngay từ những năm 50, 60 thế kỷ trước, sau khi con người có được các máy móc tự động. Ở đây, các nhà khoa học mong muốn các máy móc cũng phải biết "tự cập nhật kiến thức" để thông minh hơn, phù hợp với điều kiện và hoàn cảnh mới, thay vì ta phải "tẩy não" chúng để đưa vào các chương trình phần mềm khác. Và điểm mấu chốt trong việc phát triển của công nghệ này chính là "sự hình thành hệ chuyên gia" - là một chương trình thông minh, được gọi tên là  "Dendral" của Đại học Standford (Mỹ), nhằm dạy cho máy tính (và máy móc khác) biết được cách hoạt động của một chuyên gia thực thụ. Nhiệm vụ cơ bản của hệ chuyên gia Dendral là xác định cấu trúc phân tử các hợp chất hữu cơ lạ, chưa từng được biết đến, theo trang công nghệ Nauka.
 
Theo Nauka, đây là một xu hướng công nghệ rất thiết thực. Hiện công nghệ học máy đang được sử dụng thương mại trên quy mô lớn, trong đó có cả những nhu cầu cá nhân hóa (điều tiết chương trình cho phù hợp với nhu cầu cá nhân của người sử dụng), như các đơn chào hàng hoặc nhận dạng các kiểu tiếp xúc mới với khách hàng. 
"Dạy" cho máy móc tự học hỏi để chúng ngày càng thông minh hơn đang được thương mại hóa và đem lại nhiều lợi ích cho con người.
Các dữ liệu thống kê cho thấy, đã có tới 68% các công ty nhận thức được rằng học máy hiện là xu hướng công nghệ vô cùng thiết thực và các công ty đang hướng tới việc này, Nauka cho hay.
 
Về nguyên lý, học máy dựa trên các thuật toán, tức là tập hợp hữu hạn của các chỉ thị hay phương thức được định nghĩa rõ ràng và cần thiết, để chúng tự thu thập kiến thức. Và sau mỗi lần hệ thống khởi động dữ liệu mới, các kết quả do nó đưa ra sẽ trở nên ngày càng chính xác hơn. 
 
Theo đó, học máy chủ yếu dựa trên 4 thao tác: Phân loại/liệt kê thông tin; dự đoán những sự kiện nhất định trên cơ sở các mô hình đã được nhận dạng; phát hiện/nhận dạng các mô hình chưa được biết đến và sự phụ thuộc giữa chúng; và, phát hiện sự bất thường và các sự kiện chưa được dự đoán.
 
Tuy nhiên, học máy không phải là công nghệ bất biến. Cách thức hoạt động của nó còn phụ thuộc nhiều vào việc những thuật toán nào cần được sử dụng và những dữ liệu nào cần được tăng cường. Đó chính là cách những chuyên gia - chủ của chúng, định hướng cho chúng phải "đi" như thế nào và "bước qua những ngưỡng cửa nào".
 
Và các chuyên gia cũng chỉ ra, có tới 4 công nghệ cơ bản của học máy. Cụ thể gồm:
 
Đầu tiên là, "Học có giám sát" (Supervised Learning). Đây là trường hợp các máy tự học trên cơ sở các ví dụ. Điều này giống như các học trò nhận được từ khóa cho bài thử nghiệm và được yêu cầu tìm lời giải. Dữ liệu đầu vào được sử dụng để tìm các mối liên quan nhằm giải quyết một vấn đề cụ thể. Nếu xác lập thành công một mô hình, thì mô hình đó được sử dụng trong các trường hợp tương tự. 
 
Có thể nêu ra các ví dụ về ứng dụng dạng này, như phát hiện sự quá tải, cá nhân hóa tương tác, nhận dạng giọng nói, văn bản, hình ảnh cùng phân khúc khách hàng,...
 
Kế đó là, "Học nửa giám sát" (Semi- Supervised Learning). Trong trường hợp này, máy móc nhận được cả dữ liệu đầu vào được gắn nhãn (tức dự đoán các dữ liệu tương ứng ở đầu ra với các ví dụ cụ thể), cũng như dữ liệu đầu vào không được gắn nhãn (tức đòi hỏi sắp xếp cho dữ liệu đầu ra và tìm kiếm câu trả lời). 
 
Kiểu học máy này được sử dụng trong trường hợp khi mà một cơ quan, tổ chức có quá nhiều dữ liệu, hoặc khi các thông tin khác biệt đến mức không thể sắp xếp câu trả lời cho mỗi thông tin, đòi hỏi hệ thống tự đề xuất câu trả lời và có thể tạo ra những mô hình chung. Ví dụ về ứng dụng dạng này có thể liệt kê ra như: Nhận dạng giọng nói và hình ảnh, phân loại các trang web,...
 
Nữa là, "Học không giám sát" (Unsupervised Learning). Trong trường hợp này, máy móc không có “chìa khóa" trả lời và buộc phải tự phân tích dữ liệu, tìm kiếm mô hình và tìm mối tương quan có liên quan để đưa ra đáp án. 
 
Kiểu học máy này khiến người ta liên tưởng tới cách hoạt động của bộ não con người: Bộ não rút ra kết luận trên cơ sở quan sát tự phát và trực giác. Thêm vào đó, cùng với sự gia tăng các tệp dữ liệu, kết luận đầu ra sẽ trở nên ngày càng chính xác hơn. Ví dụ về ứng dụng dạng này như: Phân tích gói hàng, phát hiện sự bất thường, nhận dạng đối tượng tương tự,...
 
Cuối cùng là, "Học tăng cường" (Reinforcement Learning). Trong trường hợp này máy móc nhận được bộ thao tác và những quy định được phép từ trước. Hoạt động trong khuôn khổ đó, máy móc tiến hành phân tích và quan sát kết quả các thao tác để tự cập nhật và đưa ra những kết quả ngày càng tốt hơn. 
 
Có thể so sánh kiểu học máy này với học chơi bóng rổ. Các quy định về bước chân, lỗi hay bóng ra ngoài sân... là không thay đổi. Ngược lại, cách mà một đội bóng giành điểm (người chơi ném bóng từ khoảng cách xa, chạy đến gần rổ hay chuyền bóng cho người chơi khác) phụ thuộc vào quyết định tức thời của người chơi. Ví dụ về ứng dụng này như: Hoa tiêu (lựa chọn hành trình dựa trên thông tin về sự gia tăng mật độ giao thông trên đường), trò chơi điện tử, robot học,...
 
Theo các chuyên gia, máy móc có thể "tự học" được nhiều thứ, nhưng không phải là tất cả. Mặc dù khả năng hoàn thiện học máy là rất lớn, nhưng công nghệ này vẫn có một số hạn chế nhất định. Chẳng hạn máy móc không có khả năng tư duy sáng tạo và không đưa ra được các dự đoán, giả định nếu thiếu dữ liệu thích hợp. 
 
Ngoài ra, máy móc cũng không thể thu nhận các kích thích mới, chưa được biết đến, bởi mỗi một sự thay đổi dữ liệu đều gây ảnh hưởng đến công việc của máy móc. Điều đó có nghĩa là có thể gây ảnh hưởng (có chủ đích hoặc do nhầm lẫn) đối với các kết quả được thể hiện, thông qua việc thay đổi các thông tin cung cấp cho hệ thống.