Có gì đáng lo đằng sau sự phổ biến của ChatGPT? – Góc nhìn từ kỹ sư an ninh mạng | Vietcetera
Billboard banner
Một chút thời gian, một hành trình sức khỏe tuyệt vời đang chờ bạn! 🌸 Tham gia khảo sát nhé!Bắt Đầu
09 Thg 02, 2023
ChatGPT

Có gì đáng lo đằng sau sự phổ biến của ChatGPT? – Góc nhìn từ kỹ sư an ninh mạng

Khó khẳng định tương lai con người có bị thay thế hoàn toàn bởi AI không. Nhưng chắc chắn có những "cơn ác mộng" lớn khác đang diễn ra trong hiện tại nhưng lại ít được nói đến.
Có gì đáng lo đằng sau sự phổ biến của ChatGPT? – Góc nhìn từ kỹ sư an ninh mạng

Ngô Minh Hiếu (Hiếu PC), chuyên gia kỹ thuật tại Trung tâm Giám sát an toàn không gian mạng quốc gia.

Sau hơn 2 tháng, thu hút hơn 100 triệu người dùng trên thế giới, ChatGPT vẫn chưa có dấu hiệu gì sẽ giảm nhiệt. Mọi người làm meme về nó, mọi người phân tích mô hình vượt trội của nó, mọi người cảm thán về sự thông minh của nó. Thế nhưng, liệu chúng ta có “vui quá” mà bỏ qua điều gì đó quan trọng?

Vietcetera đã có một cuộc trò chuyện nhanh với anh Ngô Minh Hiếu (Hiếu PC), chuyên gia kỹ thuật tại Trung tâm Giám sát an toàn không gian mạng quốc gia, để tìm hiểu góc nhìn của anh về sự xuất hiện của ChatGPT.

Bỏ qua lo lắng về việc máy móc thay thế con người, ở góc nhìn của anh, sự thông minh vượt trội của ChatGPT có thể “đáng sợ” theo kiểu nào?

Không hẳn là (chỉ có) sự thông minh của nó đáng chú ý, mà (còn) là sự phổ biến nhanh chóng của nó.

OpenAI ra mắt ChatGPT “miễn phí” nhưng họ không hoàn toàn “cho không.” Mô hình ngôn ngữ khổng lồ của ChatGPT không chỉ được đào tạo dựa trên nguồn dữ liệu (gồm 300 tỷ từ, trích xuất từ sách, các website và mạng xã hội) của nhà phát triển, mà nó còn học từ những đoạn hội thoại với người dùng.

Việc thu hút được hàng triệu người dùng có thể cung cấp thêm nguồn dữ liệu ngày càng lớn để mô hình AI này được “học nữa, học mãi.”

Chính sách riêng tư của OpenAI cũng viết rằng họ có thể sẽ tự động thu thập thông tin của người dùng. (We collect information that alone or in combination with other information in our possession could be used to identify you. Tạm dịch: Chúng tôi thu thập các thông tin có thể dùng ngay hoặc qua kết hợp với thông tin khác mà chúng tôi sở hữu, để xác định danh tính của bạn.)

Thế nên có thể nói một trong những mối quan tâm chính với các mô hình đào tạo (training) AI này là quyền riêng tư. Đây cũng là một vấn đề mà OpenAI hay ChatGPT đang gặp phải phản ứng kịch liệt từ nhiều cộng đồng như nghệ thuật, sáng tác, lập trình viên, hay các nhà làm luật.

Một mối quan tâm khác là vấn đề “quyền được lãng quên.” Khi việc sử dụng các mô hình GPT và các mô hình máy học khác trở nên phổ biến hơn, mọi người có thể muốn có khả năng xóa dữ liệu của họ khỏi mô hình. Thế nhưng cho đến nay chưa có thông tin chính thức nào về việc người dùng có thể yêu cầu xoá dữ liệu cá nhân của mình.

Các chính sách riêng tư thường rất dài khiến nhiều người thường bỏ qua nó. Vậy nếu phải đọc thì theo anh có những điều khoản nào đáng chú ý nhất?

Một là, sự riêng tư về thông tin cá nhân, bao gồm việc ban hành các quy tắc quản lý trong việc thu thập và xử lý các dữ liệu cá nhân như thông tin tín dụng, hồ sơ y tế và các hồ sơ của chính quyền lưu trữ về công dân đó. Nó còn được gọi là “bảo vệ dữ liệu.”

Hai là, sự riêng tư về thông tin liên lạc, bao gồm bảo mật và riêng tư về thư từ, bưu phẩm, điện thoại, thư điện tử và các hình thức truyền thông khác.

Ba là, các điều khoản liên quan đến quảng cáo, chia sẻ dữ liệu với bên thứ ba.

Không cần chờ đến ChatGPT, dường như mỗi ngày chúng ta đều đã cho đi rất nhiều dữ liệu trên internet?

Có cả một danh sách dài! Bao gồm: thông tin cá nhân (tên, địa chỉ, số điện thoại, địa chỉ email), lịch sử duyệt web, cookies, thông tin tìm kiếm, vị trí, nội dung trò chuyện, các mối liên kết quan hệ và nhiều thông tin khác như hình ảnh, video, v.v.

Cách đây không lâu người ta còn tranh luận về việc các trình duyệt ẩn danh không hoàn toàn “ẩn danh.” Tuy nhiên, ít nhất thì sử dụng trình duyệt ẩn danh có thể giảm mức độ cho đi của dữ liệu cá nhân. Vẫn có thể có một số dữ liệu được ghi lại bởi các website hay các nhà cung cấp dịch vụ trực tuyến mà người dùng truy cập - nhằm cho mục đích quảng cáo hoặc bán lại dữ liệu đó cho đối tác thứ ba.

Theo anh, liệu AI có thể phát triển mà vấn đề riêng tư trong dữ liệu hay an ninh mạng (data privacy, cybersecurity) vẫn đảm bảo an toàn?

Sẽ rất khó làm được nếu không có luật an ninh mạng rõ ràng và trao quyền lựa chọn cho người dùng, như mình đã nói ở trên.

Ngoài ra, việc làm được hay không một phần cũng nằm ở nhận thức của người dùng. AI nói chung hay ChatGPT nói riêng phụ thuộc khá nhiều vào cách chúng ta cho nó “ăn gì” và “học gì.”

Chẳng hạn một người làm về an ninh mạng như mình rất thích trợ lý ChatGPT này, vì nó có thể cho nhiều gợi ý hay và rất nhanh về những đoạn mã bảo mật máy chủ, trang web, hay giải quyết những vấn đề khác liên quan đến an ninh mạng. Còn các hacker mũ đen thì có thể dùng nó để viết email lừa đảo, tìm cách cài cắm virus mã độc, v.v.

Một đoạn cap magraven higravenh yecircu cầu ChatGPT viết matilde độc theo caacutech tinh vi nghĩa lagrave ChatGPT coacute thể khocircng cung cấp cho bạn nguyecircn một moacuten vũ khiacute nhưng nếu chỉ lagrave vagravei bộ phận thigrave vẫn coacute thể Nguồn ảnh Dr Suleyman Ozarslan
Một đoạn cap màn hình yêu cầu ChatGPT viết mã độc theo cách tinh vi, nghĩa là ChatGPT có thể không cung cấp cho bạn nguyên một món vũ khí, nhưng nếu chỉ là vài bộ phận thì vẫn có thể. | Nguồn ảnh: Dr Suleyman Ozarslan.

Hiện nay OpenAI và một số công ty làm về AI cũng đang đối diện khá nhiều rắc rối liên quan đến pháp lý và kiện tụng. Tuy nhiên, mình tin rằng sắp tới các nhà làm luật sẽ đưa ra những luật áp dụng mới, chặt chẽ hơn và đảm bảo an toàn tính dữ liệu cho người sử dụng cũng như chế tài đảm bảo việc thu thập dữ liệu của các AI được minh bạch và rõ ràng hơn.

Anh nghĩ sau sự xuất hiện của ChatGPT sẽ có gì?

Có thể nói năm 2023 này sẽ là năm lên ngôi của AI. Hiện tại chúng ta đã có thể thấy cuộc đua giữa các các ông lớn công nghệ trở nên gấp gáp hơn.

Công cụ tìm kiếm Bing của Microsoft sẽ sớm cho ra mắt diện mạo mới áp dụng nhiều tính năng từ ChatGPT của OpenAI. Google cũng đang hoàn thiện “chiến binh” Google Bard của mình. Dự đoán là các sản phẩm phần mềm sáng tạo khác cũng sẽ chạy theo như phần mềm tinh chỉnh ảnh, video, sáng tạo bài viết, trợ lý ảo…

Và tất nhiên, các điều luật mới ở thế giới mạng cũng sẽ dần xuất hiện.