Mở app có ngay video hay, YouTube đọc vị bạn bằng cách nào? | Vietcetera
Billboard banner

Mở app có ngay video hay, YouTube đọc vị bạn bằng cách nào?

Có bao giờ bạn thắc mắc YouTube tuyển chọn và sắp xếp video trên trang chủ thế nào?
Mở app có ngay video hay, YouTube đọc vị bạn bằng cách nào?

Trang chủ YouTube 2005. | Nguồn: webdesignmuseum.org

Bạn sẽ cảm thấy thế nào khi bước vào một chiếc thư viện đồ sộ mà không có thủ thư để giúp bạn tìm thấy cuốn sách đúng với nhu cầu của mình? Bạn có còn mở YouTube nếu nhiều lần lướt tới lướt lui mà không tìm thấy chiếc video nào đúng ý?

Dù ít hay nhiều, mỗi chiếc video đều có nhóm khán giả của riêng nó. Và công việc của hệ thống đề xuất là tìm và dẫn tệp khán giả đó đến đúng nơi.

YouTube đã dành hơn một thập kỷ để xây dựng hệ thống này trở thành một bộ phận chủ lực giúp thu hút và giữ chân khán giả. Sức tác động của nó còn lớn hơn cả tính năng đăng ký kênh và hệ thống tìm kiếm được tối ưu hoá.

Thế nhưng đối với hầu hết mọi người hệ thống đề xuất này vẫn được xem như một chiếc hộp đen bí ẩn. Tổng hợp thông tin từ những bản nghiên cứu và báo cáo trên trang blog chính thức của YouTube, bài viết này giúp bạn hiểu phần nào cách YouTube hiểu nỗi lòng của bạn ngay khi bạn bật app, mở web.

Tư duy “trăm nghe không bằng một thấy”

Qua hơn 17 năm phát triển, YouTube có nhiều đổi thay phức tạp, nhưng nền tảng này dường như rất kiên định với việc nâng cấp hình ảnh. Các bức ảnh bìa ngày càng được phóng to. Chiếc ảnh đại diện của các chủ kênh cũng được thêm vào từ năm 2016.

Không đề xuất video mới dựa trên video bạn xem gần nhất

Trái với những gì chúng ta thường nghĩ, thuật toán của YouTube không phải lúc nào cũng dựa trên nội dung bạn cuối cùng bạn xem để đề xuất nội dung tiếp theo (trừ khi bạn là người dùng mới và lịch sử xem rất hạn chế).

Trong tài liệu được xuất bản của 3 kỹ sư phần mềm tại Google, các tác giả chia sẻ:

“Chúng tôi chọn một chiếc video ngẫu nhiên trong lịch sử xem của người dùng và xem xét hành động mà người dùng đó thực hiện trước khi dừng xem chiếc video.”

Nghĩa là nếu bạn thoát ngay chỉ sau vài giây mở một chiếc video nào đó, và sau đó là tắt luôn ứng dụng, thì ở lần truy cập tiếp theo nhiều khả năng bạn sẽ không thấy nội dung nào liên quan đến chiếc video đó. Nói cách khác, tuỳ vào mức độ thoả mãn của bạn đối với một nội dung nhất định mà YouTube sẽ đề xuất nội dung liên quan tiếp theo.

Chọn video liên quan theo 2 bộ lọc

Ở thời gian đầu, YouTube từng đề xuất video dựa theo lượt bấm, lượt xem. Nghĩa là video nào đã nổi thì càng nổi. Người mới nếu không có khả năng bứt phá sẽ khó chen chân vào bảng xếp hạng.

Phải đến năm 2015, YouTube mới có cú chuyển mình. Thuật toán của nền tảng trở nên phức tạp hơn nhiều khi độ thoả mãn trở thành cơ sở mới cho việc đề xuất.

Trang chủ của YouTube vagraveo năm 2006 Nguồn ourieltypepadcom
Trang chủ của YouTube vào năm 2006. | Nguồn: ouriel.typepad.com

Để đo mức độ thoả mãn của người dùng, YouTube cơ bản dùng đến 2 bộ lọc, bao gồm: bộ lọc ứng viên (candidate generation filter) và bộ lọc xếp hạng (ranking filter).

Cụ thể, ban đầu để một chiếc video trở thành "ứng viên" được chọn cho việc đề xuất, nó phải liên quan đến lịch sử xem của người dùng.

Đó có thể là video bạn chưa xem từ kênh YouTube mà bạn đã đăng ký, hay video đã được nhấn xem bởi những người "liên quan" đến bạn. Chẳng hạn như những người cùng yêu thích một nhóm nhạc A mà bạn đã đăng ký, những người có độ tuổi, hay vị trí địa lý gần với bạn.

Sau đó, các "ứng viên" sẽ được xếp hạng dựa vào các yếu tố như: tỷ lệ lượt bấm vào (click-through-rate), thời gian xem (watchtime), phản hồi trực tiếp về độ thoả mãn của người dùng đã xem (survey response), lượt chia sẻ, lượt thích (shares, likes, dislikes).

Cấu truacutec tổng quaacutet của hệ thống đề xuất
Cấu trúc tổng quát của hệ thống đề xuất. | Nguồn: Nghiên cứu "Deep Neural Networks for YouTube Recommendations".

Nếu bạn là người hay chia sẻ bất kỳ video nào mà bạn xem, bao gồm cả những video bạn nhấn dislike, hệ thống sẽ biết không dùng đến thông tin này để đề xuất nội dung.

YouTube cũng khẳng định hệ thống của họ không tuân theo một công thức nhất định, mà phát triển linh hoạt khi thói quen xem của bạn thay đổi.

Ưu tiên“người quen” ở hàng đề xuất trên cùng

Con người thích sự quen thuộc nhưng cũng luôn mưu cầu sự mới lạ. YouTube cho thấy mình nắm rõ bản chất đó khi luôn dành riêng hàng đề xuất trên cùng cho những thứ vừa quen vừa lạ đối với từng người dùng.

quotChuacuteng tocirci nhận thấy người dugraveng thiacutech caacutec nội dung mới lạ hơn nhưng khocircng coacute nghĩa chuacuteng khocircng liecircn quan gigrave đến những thứ đatilde coacute sẵn trong hộp sở thiacutech của họquot
Chúng tôi liên tục nhận thấy rằng người dùng thích các nội dung mới lạ hơn, nhưng không có nghĩa chúng không liên quan gì [đến những thứ đã có sẵn trong hộp sở thích của họ]. | Nguồn: Nghiên cứu "Deep Neural Networks for YouTube Recommendations".

Và để tránh cảm giác bị "dội", các video nào mang lại cảm giác quen nhiều hơn lạ, chẳng hạn như video từ YouTuber bạn đã đăng ký, vẫn thường được hiển thị trước tiên.

Nếu bạn không có nhu cầu "đánh bắt xa bờ," khám phá các chủ đề có tính liên quan thấp hơn, thì có thể chọn trang Subsription, nơi chỉ hiển thị video từ các kênh bạn đã đăng ký, thay vì ở lại trang chủ.

Loại bỏ “ứng viên phù hợp 99%”

Người được chọn (dù xuất sắc) không phải lúc nào cũng vừa ý. Video được đề xuất (dù được chấm 99 điểm phù hợp) không phải lúc nào cũng được xem. Hệ thống sẽ nhận diện các ứng viên bị thiếu 1% yếu tố duyên phận này để giảm tần suất hiển thị ở những lần truy cập sau của bạn.

Điều tương tự cũng xảy ra với các kênh chứ không chỉ với các video riêng lẻ. Các kỹ sư công nghệ của Google tiết lộ rằng họ sẽ thống kê các thông tin như: Người dùng đã xem bao nhiêu video từ kênh này? Lần cuối cùng họ xem video về chủ đề này là khi nào?

Từ đó hệ thống tính điểm gắn bó của người dùng đối với kênh YouTube đó và đưa ra quyết định có tiếp tục đề xuất nó hay không.

YouTube - Chiếc hộp không đáy

Nhiều người ví YouTube như ngôi trường "giàu có" nhất thế giới khi hơn 1 tỷ người dùng đang có mặt trên nền tảng này. Cứ mỗi phút trôi qua lại có hơn 300 giờ đồng hồ nội dung được tải lên. Và cứ mỗi ngày kết thúc lại có gần 5 tỷ video được xem.

Với kho dữ liệu đồ sộ như thế, YouTube chắc chắn không chỉ dựa vào một vài quy tắc để kết nối khán giả và người sáng tạo nội dung. Hệ thống của họ thậm chí còn liên tục thay đổi để làm tốt công việc đề xuất. Nhưng cho đến hiện tại thời gian chú ý của bạn khi xem một video bất kỳ vẫn được xem là một cơ sở dữ liệu quan trọng nhất.

Do đó, nếu bạn muốn tập trung học tập, có lẽ tốt nhất nên tạo một tài khoản riêng để YouTube chỉ đề xuất nội dung phù hợp với mục đích đó.