Công nghệ giúp chúng ta khám phá và cảm thụ tiếng Việt thế nào?

“Sự giàu đẹp của âm tiết tiếng Việt không phải là một định lý cần chứng minh; sự giàu đẹp đó là một cuộc đời vẫn đang còn sống, và chúng ta hãy cứ quan sát cuộc đời ấy. Và quan sát mãi thôi.”
Yui Nguyen
Nhóm học sinh Fulbright quan sát tác phẩm của thou. Nguồn: Lướt Code

Nhóm học sinh Fulbright quan sát tác phẩm của thou. Nguồn: Lướt Code

Tiếng Việt là một sinh ngữ, tức kho từ vựng, cách phát âm và hành văn luôn biến hoá theo thời gian và thời cuộc. Tiếng Việt chúng ta nói ngày hôm nay đã rất khác so với tiếng Việt ở những thập kỷ và thế kỷ trước. Trong thời đại công nghệ lên ngôi hiện nay, những ngôn ngữ lập trình có thể giúp chúng ta khám phá và cảm thụ tiếng Việt như thế nào?

Tiếng Việt là một kho dữ liệu khổng lồ

Lướt Code, một câu lạc bộ khoa học và công nghệ hướng đến cộng đồng thực hành nghệ thuật, đã khởi động một dự án tổng hợp toàn bộ âm tiết tiếng Việt. Mục đích của dự án này là để tìm hiểu về cảm giác mà mỗi âm tiết tiếng Việt tạo ra ở người nghe. Và liệu có một kiểu mẫu hay công thức nào cho cảm giác mà các từ gần âm hoặc cùng thanh điệu tạo ra?

Nếu nhìn tiếng Việt là một bộ dữ liệu (dataset), thì phần tử nhỏ nhất của chúng là những âm tiết. Từ kho từ vựng được tổng hợp bởi Underthesea, từ điển số Soha và từ điển Hoàng Phê, Lướt Code đã tổng hợp danh sách 6.000 từ đơn có định nghĩa.

Tuy vậy, trong số 6.000 từ ấy không có những từ xuất hiện nhiều trong đời sống. Ví dụ như từ “nhật”, “hoài”, “diệu” và những từ ngữ phổ biến trên không gian mạng như “khum”, “hem”, “trùi”,... Nhận thấy giới hạn của từ điển, Lướt Code đã tái tạo nên kho âm tiết bao hàm thêm những âm vô nghĩa hoặc chưa có nghĩa trong từ điển, tổng cộng là 82.000 âm tiết.

Với những dẫn nhập theo đề tài ngữ lý học, Luớt Code giới thiệu dự án đến cộng đồng các nghệ sĩ và những người yêu chữ, và mở rộng thành một chương trình fellowship. Thứ 7, 28/9 là buổi trưng bày đầu tiên của 3 nghệ sĩ trẻ tham gia vào fellowship này: Dmarc Lê, Đông-Trúcthou. Cả 3 tác phẩm đều xoay quanh hai phạm trù: Công nghệ và cảm tình với tiếng Việt.

Các tác phẩm sẽ được tiếp tục trưng bày tại Bảo tàng Phụ nữ Việt Nam, Hà Nội từ ngày 16 - 22/11, và tại TP.HCM từ 29/11 đến 5/12 trong khuôn khổ Lễ hội Sáng tạo và Thiết kế 2024.

Sức nặng của một âm tiết đến từ đâu?

Tác phẩm “Xác Âm” của Dmarc Lê khởi phát từ câu hỏi: “Sức nặng của một bài thơ được thể hiện như thế nào ở dạng vật lý?”

Cô nghệ sĩ xứ Huế đã quan sát cách phát âm của chính mình và đối chiếu với hệ thống ASJP, vốn là một hệ thống phân tích cách phát âm theo sự vận động và cách đặt để răng, môi và thanh quản.

Sức nặng của một âm tiết tỉ lệ thuận với độ phức tạp khi vận động các cơ quan để phát âm. Lướt Code đã kết hợp với Dmarc tạo ra một chương trình chấm điểm từng âm tiết của một bài thơ để tạo ra một bảng điểm độ nặng. Với bảng điểm đó, Dmarc sẽ khò lửa trên tấm nhôm, thời gian khò sẽ tương ứng với số điểm cao thấp của mỗi âm trong bài thơ.

Muốn cảm âm, hãy tắt nghĩa

Đó là tinh thần của Đông-Trúc trong tác phẩm “Bên kia của vần”. Khi nghe một từ mà mình không biết nghĩa, chúng ta sẽ tập trung vào cảm giác của từ đó mang lại. Trúc đã tạo ra một trò chơi khám phá cảm giác của các từ tiếng Mường, thực hiện cùng khoảng 100 người chơi khắp Việt Nam, và ghi chép lại vào một quyển zine về kết quả cũng như các trao đổi từ người chơi.

Vì sao lại là tiếng Mường? Trong ngữ hệ Nam Á, tiếng Mường là người anh em thân cận nhất với tiếng Việt, tách ra từ tiếng Việt-Mường. Khác biệt của tiếng Việt nằm ở xu hướng đơn âm tiết hoá triệt để, còn tiếng Mường vẫn lưu giữ các phụ âm kép (như bl, tl,...) rất gần với tiếng Việt trung đại.

Là một cô gái đến từ Vùng kinh tế mới Di Linh, tuổi thơ của Trúc luôn có âm vang tiếng Mường từ hàng xóm. Trong dự án này, Trúc đã cùng ngồi với họ để nghe cách họ phát âm và giải thích nghĩa của các từ được chọn trong từ điển Việt-Mường.

Quyển zine “Bên kia của vần” sẽ còn được viết tiếp ở những lần chơi tiếp theo khi Trúc mang trò chơi này đi khắp thế gian.

Bắt nắng làm thơ

Nếu cây cối trong thành phố được nói, chúng sẽ nói gì? Công nghệ có thể giúp chúng ta “nghe” được tiếng vọng của những mảng xanh đang mất đi không?

Đó là nỗi niềm của thou khi thực hiện tác phẩm “để quá khứ sẽ (tiếp diễn)”. Sau khi hệ thống 49 từ xuất hiện nhiều trong các bài báo liên quan về cây xanh ở TP.HCM, thou cùng Lướt Code đã tạo nên một lưới từ vựng. Khi đặt lưới từ này lên một mảng sân hay mảng tường loang lổ sáng tối do nắng chiếu qua tán cây, những vùng sáng nhất sẽ “bắt” từ ở đó để viết thành một bài thơ theo cú pháp “để…sẽ” lặp đi lặp lại đến vô cực.

Tiếng Việt của mai sau

Giữa những câu hỏi về công nghệ như liệu AI có thể thay thế con người được không? Sự giàu đẹp của tiếng Việt còn giữ được trong tương lai hay không?, buổi trưng bày của Lướt Code mở ra một cách đặt vấn đề khác: Công nghệ sẽ giúp chúng ta nhìn rõ cảm tình của mỗi cá nhân với tiếng Việt thế nào?

“Sự giàu đẹp của âm tiết tiếng Việt không phải là một định lý cần chứng mình; sự giàu đẹp đó là một cuộc đời vẫn đang còn sống, và chúng ta hãy cứ quan sát cuộc đời ấy. Và quan sát mãi thôi.” Sẽ thật là nhân văn khi cộng đồng người Việt Nam chúng ta có thêm nhiều cơ hội để sử dụng công nghệ để cảm nhận và sáng tác; và Lướt Code sẽ tiếp tục lan toả chủ đề này trong tương lai.

Bạn có thể đọc về toàn bộ Dự án tiếng Việt của Lướt Code tại đây.


Xem phiên bản đầy đủ

Xem nhiều nhất

Cùng chuyên mục