ChatGPT ra mắt cuối năm 2022, thu hút sự chú ý từ khắp nơi trên thế giới. Ứng dụng này thu hút hàng triệu người dùng chỉ sau 1 tuần ra mắt và được The New York Times ca ngợi "chatbot trí tuệ nhân tạo tốt nhất từng được phát hành ra công chúng." Tại Việt Nam, nhiều người dùng thậm chí chi tiền để trải nghiệm sản phẩm này.
Song song với những khả năng vượt trội như sáng tác thơ, viết nghiên cứu, chữa lỗi lập trình, ChatGPT cũng đang tạo ra vô vàn những cuộc tranh cãi trong các lĩnh vực chủ chốt như giáo dục, truyền thông và nghệ thuật.
Cùng tìm hiểu cách chatbot này trở thành cơn sốt trên toàn cầu.
Generative AI
Generative AI bao gồm các loại mô hình trí tuệ nhân tạo có khả năng sáng tạo nội dung dựa trên hệ thống dữ liệu có sẵn. Các mô hình này có thể tạo ra sản phẩm với đa dạng hình thức, từ các bài viết, hình ảnh, tranh vẽ, cho đến âm nhạc và ngôn ngữ lập trình.
Chúng ta hẳn vẫn còn nhớ đến sự bùng nổ của các ứng dụng như MidJourney và DALL-E 2. Với sự hỗ trợ của generative AI, hai ứng dụng kể trên có thể tạo ra những bức tranh ấn tượng chỉ dựa trên từ khóa mà người dùng yêu cầu.
Mô hình trí tuệ nhân tạo của ChatGPT liên quan đến tạo lập ngôn ngữ. Chatbot này mô phỏng quá trình giao tiếp bằng ngôn ngữ con người. ChatGPT cho phép người dùng tương tác bằng cách đặt câu hỏi sau đó đưa ra phản hồi một cách tự nhiên và nhanh chóng.
Khác với những chat bot thông dụng thường chỉ có khả năng trả lời những câu hỏi nhất định, ChatGPT có thể đưa ra câu trả lời cho những vấn đề phức tạp trong đa dạng lĩnh vực. Nếu như “người anh em” DALL-E 2 có thể vẽ tranh theo yêu cầu, ChatGPT cũng có thể sáng tác truyện, thơ, giải toán, viết luận và ngôn ngữ lập trình khi được hỏi.
Language Model
Thuật ngữ Language model, hay mô hình ngôn ngữ, trong ngành Xử lý ngôn ngữ tự nhiên (NLP) mô tả quá trình áp dụng các kỹ thuật thống kê để xác định xác suất của một chuỗi các từ trong một câu nhất định. Ứng dụng quen thuộc của mô hình ngôn ngữ chính là chức năng gợi ý từ ở các điện thoại thông minh hay thanh tìm kiếm Google.
Mô hình ngôn ngữ GPT-3 chính là “bộ não” của ChatGPT. Với 175 tỷ tham số, GPT-3 là một trong những mô hình AI xử lý ngôn ngữ lớn và mạnh mẽ nhất hiện nay, sánh ngang với chatbot BlenderBot 3 của “người khổng lồ” Meta AI.
Sở hữu một “bộ não” với hiệu năng vượt trội chính là lý do cốt lõi để ChatGPT có thể vượt qua những câu trả lời máy móc quen thuộc. Từ đó thảo luận với người dùng về các vấn đề triết học, vật lý lượng tử, viết các nghiên cứu học thuật, hay thậm chí ngợi ca chính mình.
“ChatGPT có thể đưa ra phản hồi nhanh chóng, cho phép các cuộc hội thoại linh hoạt và đa dạng hơn. Chính bởi vì được dựa trên mô hình GPT-3 mạnh mẽ, ChatGPT có nền tảng tri thức trải dài nhiều lĩnh vực, đồng thời có thể hiểu và phản hồi nhiều đa dạng các chủ đề.” Đó là lời ngợi ca GPT-3 dành cho ChatGPT.
Dataset
Dataset là tập hợp các dữ liệu được quản lý và sắp xếp theo cấu trúc nhất định. Đây chính là chìa khóa của quá trình đào tạo và phát triển các mô hình trí tuệ nhân tạo. Tập dữ liệu là thứ khiến ChatGPT nổi bật so với các loại chatbot thông dụng khác.
Sự vượt trội của GPT-3 cho phép ứng dụng này xử lý một lượng dữ liệu văn bản khổng lồ từ internet, bao gồm các website, trang blog, tạp chí, sách báo và nghiên cứu học thuật. Theo The Conversation, dung lượng dữ liệu văn bản của ChatGPT có thể lên tới 570GB. Để dễ hình dung, 570GB này tương đương với một văn bản dài 300 tỷ từ, trải dài trên 385 triệu trang Word.
Tuy vậy, việc tiếp nhận một lượng thông tin lớn không đồng nghĩa với mọi câu trả lời đều chính xác. Một trong những giới hạn rõ ràng nhất của ChatGPT là phần mềm này thường xuyên đưa ra những câu trả lời vô nghĩa hoặc không chính xác.
Đồng thời, việc tiếp nhận các dữ liệu có sẵn vốn được tạo ra bởi con người, cũng khiến cho các câu trả lời có thể mang định kiến, tư tưởng phân biệt hay gián tiếp lan truyền thông tin sai sự thật.
Reinforcement Learning from Human Feedback
Học tăng cường thông qua phản hồi của con người (RLHF) là phương pháp công ty chủ quản OpenAI sử dụng để đào tạo và phát triển ChatGPT.
Theo tạp chí BBC Science Focus, các chuyên gia đào tạo trước tiên cung cấp các cuộc hội thoại của con người để mô tả các phản hồi họ mong muốn. Nếu các phản hồi chưa đạt yêu cầu, người đạo tạo (AI Trainer) sẽ nhập các câu trả lời đúng, giúp xây dựng dữ liệu cho hệ thống.
Tiếp đó, các phản hồi của chatbot sẽ liên tục nhận được đánh giá từ đội ngũ đào tạo và người dùng. Sau khi tiếp nhận đánh giá cho các câu trả lời, hệ thống AI sẽ liên tục so sánh các phản hồi này với nhau. Quá trình “thử và sai” này diễn ra lặp đi lặp lại, cho đến khi chatbot có được phản hồi tối ưu và chính xác nhất.
Tuy vậy, thuật toán này chỉ đạt hiệu quả khi đánh giá của các chuyên gia và người dùng có cơ sở rõ ràng. Nếu phản hồi từ con người không đảm bảo được tính khách quan và chính xác, những phản hồi của chatbot cũng kém hiệu quả và chứa thông tin sai lệch.
Ethical issues
Ethical issues, hay các vấn đề đạo đức, là các tình huống xảy ra khi có sự xung đột giữa các sự kiện, tình huống với nguyên tắc đạo đức xã hội. Trong suốt nhiều năm trở lại đây, sự phát triển vượt bậc của trí tuệ nhân tạo luôn kéo theo hàng loạt tranh cãi xoay quanh các vấn đề như quyền riêng tư, độ an toàn và thị trường lao động.
Sự bùng nổ của các ứng dụng như ChatGPT cũng không nằm ngoài xu hướng ấy. Chính các nhà sáng lập cũng lo ngại việc công cụ này bị lạm dụng cho những mục đích xấu. Các tranh cãi về chatbot này đang diễn ra ở rất nhiều lĩnh vực, bao gồm truyền thông, giáo dục và nghệ thuật.
1. Truyền thông
Sau 2 tháng ra mắt, ChatGPT vẫn thường xuyên phải xin lỗi người dùng vì những phản hồi chưa chính xác. Vô vàn các câu trả lời sai lệch hoặc vô nghĩa vẫn chưa được chỉnh sửa. Với hàng triệu lượt sử dụng, ChatGPT có nguy cơ trở thành công cụ hoàn hảo để phát tán tin giả, ngôn ngữ thù ghét hay phân biệt đối xử.
Cùng với đó, các phản hồi của chatbot cũng phần nào phản ánh quan điểm của các chuyên gia đào tạo. Như vậy, nếu quá trình đánh giá của Open AI không đủ khách quan và chặt chẽ, các câu trả lời sẽ chịu ảnh hưởng của thiên kiến và có khả năng thao túng người dùng.
2. Sáng tạo
Với những gì ChatGPT đang thể hiện, các nghệ sĩ và nhà sáng tạo nội dung có thể tận dụng chatbot này trong xuyên suốt quá trình tạo ra sản phẩm. Từ khâu lên ý tưởng, nghiên cứu, cho đến viết và hoàn thiện sản phẩm, các blogger có thể chỉ cần vài phút để có được một bài viết hoàn chỉnh.
Quá trình sáng tạo luôn là yếu tố góp phần vào giá trị của những tác phẩm nghệ thuật. Một bài viết không chỉ hay bởi thông điệp và từ ngữ, mà còn là bởi nó chứa đựng công sức, nỗ lực và khát khao của tác giả. Đối với khán giả, trải nghiệm nghệ thuật còn là bao hàm cả việc cảm nhận quá trình lao động của người nghệ sĩ.
Điều này đặt ra nhiều câu hỏi lớn với quá trình sáng tạo và tiếp nhận các sản phẩm. Sẽ ra sao nếu cả quá trình dày công trước đây được thay thế bằng vài phút mô tả cho ChatGPT? Các tác phẩm liệu có còn nguyên giá trị, nếu như quá trình lao động miệt mài được thay thế bởi hàng loạt thao tác đơn giản?
Câu trả lời cho những câu hỏi kể trên sẽ ảnh hưởng trực tiếp đến cách mỗi chúng ta tiếp nhận các sản phẩm sáng tạo trong thời đại này.
3. Nghiên cứu và giáo dục
Cách đây không lâu, ChatGPT chính thức trở thành đồng tác giả của một nghiên cứu quốc tế do công ty Elsevier B.V. xuất bản. Cùng với đó, rất nhiều trường đại học cũng đang lo ngại chatbot này trở thành một công cụ để gian lận trong các kỳ thi.
Nhiều đại diện của các cơ sở giáo dục còn lo ngại công cụ này sẽ khiến các học sinh, sinh viên lười tư duy và thiếu kỹ năng giải quyết vấn đề. Trong lĩnh vực nghiên cứu học thuật, ChatGPT có thể bị lợi dụng để viết ra các nghiên cứu kém chất lượng, với nội dung đạo văn, sơ sài hay thậm chí ngụy tạo nguồn tham khảo.
Như vậy, ChatGPT chưa thể thay thế các nhà nghiên cứu, nhưng có nguy cơ đe dọa đến những giá trị như tinh thần liêm chính, khách quan, đạo đức mà giới khoa học luôn đặt lên hàng đầu.
Cho đến thời điểm hiện tại, các sản phẩm của ChatGPT, bao gồm các bài nghiên cứu, bài luận vẫn đang chứa đựng rất nhiều vấn đề. Chatbot này chỉ đóng vai trò như một công cụ hỗ trợ cho quá trình tư duy, nghiên cứu và sáng tạo. Tuy nhiên, những chất vấn kể trên là cần thiết để đưa ra các chính sách mang tính hệ thống đối với các công nghệ có ảnh hưởng sâu sắc đến nhiều lĩnh vực.