tóm lại là machine learning

Tóm Lại Là: Machine learning là gì? Bao giờ robot gây chiến với con người?

1. Machine learning là gì?

Machine learning (học máy) là một lĩnh vực của ngành khoa học máy tính. Lĩnh vực này nghiên cứu cách khiến máy tính tự học hỏi trên những dữ liệu thu thập được mà không cần được lập trình cụ thể.

Một ví dụ của machine learning là tính năng Discover Weekly của ứng dụng nghe nhạc Spotify. Mỗi sáng thứ Hai, Spotify tạo một playlist gồm 30 bài hát được chọn lọc tự động theo sở thích của từng người dùng.

Với machine learning, máy tính “thấu hiểu” gu nhạc của 100 triệu người dùng Spotify mà không cần được lập trình 100 triệu lần khác nhau.

machine learning
Machine learning là một phần của môn khoa học trí tuệ nhân tạo (artificial intelligence).

2. Tại sao chúng ta cần máy học?

Giả sử, bạn đang tìm mua một chiếc xe hơi. Bạn được báo giá chiếc xe mới khoảng 1 tỷ đồng. Bạn thấy người ta rao bán xe cũ đã đi được một năm ở mức 900 triệu. Và những chiếc xe đã lăn bánh được 2 năm có giá khoảng 800 triệu.

Nếu học hết toán lớp 5, bạn sẽ dễ dàng nhận ra quy luật định giá xe dựa trên tuổi đời của chiếc xe: cứ sau một năm sử dụng, chiếc xe xuống giá 100 triệu.

Theo ngôn ngữ machine learning, bạn vừa tìm ra regression (hồi quy), tức phương trình tính giá xe dựa trên mối quan hệ giữa các dữ liệu trong quá khứ. Sẽ thật đơn giản nếu bài toán mua xe chỉ dừng ở đó.

Trên thực tế, có rất nhiều phương diện cần phải cân nhắc khi định giá xe ngoài tuổi đời của nó: hãng sản xuất, độ hiếm, tình trạng xe, số km đã đi… Để tính toán chừng ấy thông tin của hàng ngàn chiếc xe rồi so sánh và lựa chọn, một người bình thường có thể mất đến vài trăm giờ đồng hồ.

Với học máy, máy tính có thể làm điều này trong vài giây. Đó là lý do một số ứng dụng được lập trình để tự động phân tích thị trường xe cũ, định giá xe, và đưa ra gợi ý phù hợp nhất cho người mua.

3. Machine learning hiện hữu ở đâu xung quanh ta?

Học máy đang được ứng dụng khắp nơi trong cuộc sống của chúng ta, ví dụ như:

  • Gợi ý sản phẩm cho người dùng trên Tiki, Shopee, Spotify, Netflix;
  • Lọc email spam, nhận diện email quan trọng trong Gmail, Yahoo! Mail;
  • Nhận diện khuôn mặt và hình ảnh trên Snapchat, Instagram, Facebook;
  • Đọc và dịch văn bản qua nhiều ngôn ngữ;
  • Dự đoán chu kỳ kinh nguyệt, giá cổ phiếu, cung cầu trên thị trường, tình hình giao thông, thời tiết;
  • Theo dõi và kiểm soát các dịch bệnh như virus corona;
  • Phát triển các dòng máy hút bụi tự động, chatbot, các trợ lý ảo như Siri, Alexa, Google Assistant, hay xe không người lái.

4. Ai cần học sâu về machine learning? Học machine learning xong làm gì?

Nhờ cuộc đua công nghệ giữa các công ty và quốc gia, nhân lực ngành trí tuệ nhân tạo đang hưởng mức lương khủng. Một số con đường sự nghiệp phổ biến làm việc trực tiếp với machine learning là:

  • Kỹ sư machine learning (machine learning engineer);
  • Kỹ sư phần mềm (software engineer);
  • Nhà thiết kế trải nghiệm thông minh (human-centered machine learning designer);
  • Nhà khoa học dữ liệu (data scientist);
  • Nhà phân tích dữ liệu/kinh doanh (data/business analysts);
  • Kỹ sư ngôn ngữ tự nhiên (natural-language-processing engineer)

Machine learning thuộc lĩnh vực toán – tin. Nếu có nền tảng và tiếng Anh tốt, bạn có thể thử khóa học Machine Learning của Giáo sư Đại học Stanford Andrew Ng.

5. Máy tính “ăn” những gì để thông minh?

Để tự động hóa quá trình học, máy tính cần 3 thứ sau:

Dữ liệu (Data)

Muốn ứng dụng Gmail tự động phát hiện spam? Hãy thu thập các tin nhắn spam trong thực tế. Muốn dự đoán giá cổ phiếu? Hãy thu thập lịch sử giá. Muốn biết người dùng thích gì? Hãy phân tích những lượt search, cái like của họ trên Facebook. Dữ liệu nạp vào càng đa dạng thì máy tính cho ra kết quả càng chính xác.

Đặc trưng (Features)

Các đặc trưng là “tấm bản đồ” máy tính dùng để tham chiếu trong suốt quá trình “tự học”. Ví dụ, chúng ta biết rằng xe càng cũ thì càng xuống giá. Do đó, số công tơ mét của chiếc xe có thể làm tham chiếu định giá. Như vậy, số công tơ mét là một đặc trưng của bài toán định giá xe.

Thuật toán (Algorithm)

Những kỹ sư tin học dùng các thuật toán để giúp máy tính tự “nhào nặn” những dữ liệu và đặc trưng được thu thập trong suốt quá trình máy tính “học”. Thuật toán sẽ ảnh hưởng đến độ chính xác, tính hiệu quả và quy mô của kết quả cuối cùng được máy tính trả về.

6. Máy học như thế nào?

Máy tính có thể tiếp nhận dữ liệu đầu vào hoặc tự thu thập dữ liệu trong quá trình “học”. Đồng thời, các đặc trưng được thiết lập để lọc thông tin cần thiết. Cuối cùng, các kỹ sư phần mềm dựa vào những đặc trưng để tạo ra các thuật toán.

tóm lại là machine learning
4 Mô hình machine learning phổ biến.

Hiện nay phổ biến 4 mô hình học máy, đó là:

1. Học máy cổ điển (Classical machine learning)

Sử dụng các thuật toán machine learning truyền thống, mô hình này giải quyết những bài toán có dữ liệu đơn giản và đặc trưng rõ ràng. Điển hình là bài toán định giá ô tô.

2. Học máy củng cố (Reinforcement learning)

Cách này sử dụng phổ biến để giải quyết những bài toán không có dữ liệu đầu vào sẵn. Dữ liệu sẽ được nhập vào trực tiếp trong suốt quá trình máy tính “tự học”.

Ví dụ, máy tính có thể học chơi cờ bằng cách chơi nhiều và thất bại nhiều. Khi học được cách thua, máy tính tránh lặp lại những bước đi bất lợi và chọn những nước cờ nâng xác suất chiến thắng.

3. Học máy kết hợp (Ensemble learning)

Đây là sự kết hợp cả hai mô hình trên vào cùng một bài toán cụ thể, cùng một tập dữ liệu đầu vào. Từ đó sẽ chọn ra được phương thức tối ưu để cho ra những kết quả tốt nhất.

4. Mạng thần kinh nhân tạo và Học sâu (Neural network & deep learning)

Đây là những mô hình cải tiến ở cấp độ cao hơn của những mô hình học máy khác, được sử dụng trong những trường hợp có dữ liệu đầu vào phức tạp và những đặc trưng không rõ ràng.

7. Bao giờ thì máy móc thông minh đủ để gây chiến với loài người?

Gây chiến thì nhiều khả năng là không, nhưng máy móc được dự đoán sẽ thay thế một phần (không nhỏ) nhân lực trong tương lai.

Tuy nhiên, ngay cả các chuyên gia cũng không dám chắc về những dự đoán của họ. Lý do là vì các bước tiến khoa học khá khó lường, và trí thông minh được đánh giá dựa trên rất nhiều yếu tố chứ không riêng gì việc ghi nhớ bao nhiêu dữ liệu hay làm toán nhanh đến đâu.

Google Translate dịch thuật khá tốt ở một số ngôn ngữ, nhưng điều đó không có nghĩa là phần mềm này có thể thay thế được phiên dịch viên, dịch giả, nhà báo, hay nhà ngoại giao.

Bài viết được thực hiện bới Trương Tử Long, tham khảo từ bài viết của tác giả vas3k.

#TómLạiLà trả lời ngắn gọn 7 câu hỏi quan trọng nhất xung quanh một sự kiện: Ai? Làm gì? Khi nào? Ở đâu? Bao nhiêu? Như thế nào? Tại sao?

Xem thêm:
[Bài viết] Tóm lại là: Vì sao ‘Parasite’ gây chấn động tại Oscar?
[Bài viết] Tóm lại là: Brexit – Giải thích ngắn gọn dễ hiểu nhất Trái Đất