Vietnam Innovators Digest5 Từ vựng để hiểu tranh AI vẫn chạy trên sức người như thế nào

Sự phổ biến của các phần mềm nghệ thuật sử dụng AI dễ làm ta tưởng rằng trí tuệ nhân tạo thực sự có thể làm nghệ thuật. Trên thực tế, AI không "làm ra" thứ gì hết, mà tất cả tới từ con người.

Sơn Hoàng

07 Thg 12

5 Từ vựng để hiểu tranh AI vẫn chạy trên sức người như thế nào

Nguồn: Louis Rosenberg via Midjourney

Ta vẫn thường nghĩ về trí tuệ nhân tạo như một thực thể vô tri, không có những rung động nghệ thuật và không thể sản xuất ra những tác phẩm nghệ thuật. Nhưng thời gian gần đây, nhiều ứng dụng đã tận dụng khả năng của AI để làm ra nhiều sản phẩm ấn tượng và bắt mắt.

Một ví dụ của những ứng dụng nghệ thuật từ trí tuệ nhân tạo là Lensa. Lensa đã cho ra mắt tính năng “magic avatar” có khả năng sản sinh ra hàng chục, thậm chí hàng trăm bức chân dung về một cá nhân theo nhiều phong cách khác nhau. Khả năng này khiến Lensa trở thành một công cụ sản xuất chân dung cách điệu rẻ và nhanh nhất.

Tuy nhiên, nhiều người cho rằng ứng dụng này không thực sự “vẽ” ra những bức tranh ấy, mà đã ăn cắp từ sản phẩm của rất nhiều nghệ sĩ khác. Thực hư của cáo buộc này là thế nào, và quan trọng hơn, ta nên đối xử với AI và những tác phẩm do AI làm ra thế nào?

Để có dữ kiện cho câu hỏi này, ta cần biết về cách mà AI hoạt động và phát triển năng lực phán đoán của nó. Đó chính là những điểm chính mà chúng ta sẽ khám phá với 5 thuật ngữ về trí tuệ nhân tạo và quá trình nó học tập, sản sinh ra các bức tranh.

1. Machine learning

Machine learning, hay “máy học,” từng là một hướng nghiên cứu trong nhóm ngành trí tuệ nhân tạo. Trong một vài năm gần đây, với sự phát triển của AI và nhu cầu “dạy học” cho AI, nhiều tổ chức đã sử dụng cụm machine learning tương đương với cụm trí tuệ nhân tạo.

Về cơ bản, machine learning nghiên cứu các kỹ thuật và phương pháp để phát triển trí tuệ nhân tạo bằng cách giúp cho máy tính thực hiện các công việc nhất định mà không cần phải lập trình cụ thể cho hành động đó. Có nhiều cách để làm việc này, và cách phổ biến nhất là để máy học dưới sự giám sát của con người, từ đó đưa ra phán đoán dựa trên những dữ liệu nó đã học.

Một trong những ví dụ về machine learning và sự hiện diện của nó trong quá trình chúng ta tương tác với internet là các bộ captcha hình ảnh. Đó là những captcha với 9 ô vuông yêu cầu người xem chọn ra đâu là cái đèn giao thông, đâu là núi đồi, hay vạch kẻ đường, hoặc xe đạp.

07dec2022wdzbiufgjbbnfkaj7mqwbfdfcy2p187w2wgg6uwog1jpg — Nguồn: Getty Images

Những lựa chọn của chúng ta được trả về kho dữ liệu và từ đó được chuyển tiếp sang để các phần mềm “học” xem cái gì là cái gì, kết nối giữa sự vật và định danh của nó. Với đủ dữ kiện, AI còn có thể học những khái niệm trừu tượng hay những trường từ vựng về cảm xúc - thứ mà nó không thể cảm nhận.

2. Generative model

Generative model, hay mô hình sản sinh, là công cụ để trí tuệ nhân tạo sản sinh ra những sản phẩm mới dựa trên những dữ kiện nó đã học. Các dữ liệu mà AI tiếp nhận thường được thể hiện dưới dạng các mô hình (models). Tới lượt mình, AI có thể dựa trên những mô hình có sẵn để tạo ra các sản phẩm thỏa mãn tiêu chí của các mô hình đó.

Ví dụ, một AI sau khi học tập cơ sở dữ liệu về các bài thơ trong phong trào Thơ Mới có thể tạo ra một bài thơ theo phong cách tương tự dựa trên những từ mà nó đã được học, những cú pháp mà nó đã tiếp xúc, và những thủ pháp nghệ thuật tiêu biểu của phong trào.

07dec2022image20221207172403033png — Một bài thơ lục bát theo phong cách nhà thơ Nguyễn Bính, làm bởi công cụ sáng tác thơ tiếng Việt mang tên Thơ Máy. | Nguồn: thomay.vn

Thay thơ bằng hình ảnh chân dung, và ta có được cách Lensa tạo ra hàng trăm bức chân dung cách điệu về một người theo nhiều phong cách nghệ thuật khác nhau.

Ngoài ra, mô hình sản sinh còn cho phép AI phân loại các sản phẩm khác nhau, từ đó xác định tính đúng đắn của một sản phẩm so với những hình mẫu của nó. Ví dụ, nếu đưa một câu tiếng Việt cho một trí tuệ nhân tạo mới “tốt nghiệp” cơ sở dữ liệu tiếng Việt, nó có thể xác định xem câu được đưa ra có đúng ngữ pháp không, có phải là tiếng Việt không.

Điều tương tự xảy ra trong nghệ thuật: đưa cho AI một bức tranh, nó sẽ phân loại xem tranh đó là tranh gì, thuộc vào trường phái hay phong cách nào,... Đưa cho AI một bài hát sau khi nó mới học về nhạc rap, và nó sẽ xác định được xem bài hát đó có phải nhạc rap không, nếu có thì là phong cách nào, giống với nghệ sĩ nào,...

3. Creative Technologist

Creative Technologist, tạm dịch là kỹ thuật viên sáng tạo, là một công việc xoay quanh công nghệ và việc thử nghiệm phần mềm.

Chức vụ này có phần hơi mơ hồ, và công việc của các kỹ thuật viên sáng tạo có thể bao gồm nhiều hoạt động khác nhau, trong đó có việc viết mã mã để sản sinh ra hình ảnh, âm thanh, hay ngôn từ, chạy thử các sản phẩm, điều phối các phiên bản của ứng dụng, tìm kiếm vấn đề và áp dụng những thay đổi để giải quyết vấn đề.

Các kỹ thuật viên sáng tạo là những người tham gia trực tiếp vào quá trình phát triển trí tuệ nhân tạo. Họ có mặt từ quá trình lên ý tưởng, thiết kế mô hình, tới phát triển các bản mẫu của sản phẩm để thử nghiệm, giám sát việc hoàn thành sản phẩm từ đầu chí cuối.

4. Latent Space

Latent Space, tạm dịch là không gian ngầm, là một tính chiều không gian ảo dùng để tập hợp và sắp xếp dữ liệu. Chính latent space là thứ cho phép AI hình dung và phân tích một đối tượng dựa theo những thông tin đã có sẵn. Nó vừa nén kích thước của dữ liệu, vừa sắp xếp các dữ liệu có độ tương đồng cao ở gần nhau dưới dạng các điểm dữ liệu (data point).

Ví dụ, một phần mềm trí tuệ nhân tạo được áp dụng để quản lý giao thông. Nó sẽ phải phân biệt giữa ô tô, xe máy, xe đạp, xe đạp điện,... Để làm được điều này, nó sẽ sắp xếp các thông tin về phương tiện giao thông vào latent space. Những thông tin tương tự nhau sẽ được xếp gần nhau hơn, ví dụ như thông tin về những chiếc ô tô của nhiều hãng khác nhau, hay những loại xe đạp khác nhau thì sẽ được thể hiện cạnh nhau trên latent space.

Trong quá trình nén dữ liệu, những thông tin không liên quan sẽ được loại bỏ, chỉ để lại những thông tin cơ bản giúp phân biệt các nhóm thông tin với nhau. Ví dụ, trí tuệ nhân tạo không quan tâm là phương tiện giao thông này màu gì, dài hay ngắn,... bởi những thông tin đó không giúp phân biệt các phương tiện. AI chỉ giữ lại những dữ kiện cho thấy sự khác biệt của đối tượng, ví dụ như ô tô là phương tiện gắn máy có bốn bánh, còn xe đạp thì có hai bánh và “chạy bằng cơm.”

Khi có một hình ảnh phương tiện giao thông, AI sẽ tinh giản dữ liệu thông qua quá trình nén và xác định chúng ở đâu trong latent space. Từ đó, AI có thể gọi tên và phân loại phương tiện đó.

5. Neural Network

Neural network, tạm dịch là mạng lưới liên kết, là một chuỗi các thuật toán giúp phần mềm nhận ra mối quan hệ hay sự liên kết giữa những bộ dữ liệu, từ đó tự động đưa ra các quyết định hay lựa chọn. Neural network được xây dựng dựa trên cách mà bộ não người hoạt động, xử lý dữ liệu để đi tới quyết định và hành động.

Về cơ bản, neural network là thứ giúp cho AI có thể học hỏi từ chính những sai lầm của nó và liên tục tiến hóa. Mạng lưới liên kết này cho phép trí tuệ nhân tạo giải quyết các vấn đề phức tạp với độ chính xác cao, đưa ra các lựa chọn thông minh mà không yêu cầu nhiều sự trợ giúp từ con người.

#AI - Trí tuệ nhân tạo#Công nghệ#machine learning

Bruce Delteil: "AI có thể tăng tốc chiến lược, nhưng phán đoán con người mới là thứ định hình chiến lược”

AI slop trở thành “từ ngữ của năm”, liệu đây có phải tương lai của Internet?

Khanh Ngô: AI là điểm yếu lớn nhất của doanh nghiệp Việt trong bối cảnh chuyển đổi số

Diện mạo MớiTính năng Mới