Mỗi lần nhắc đến đồ họa của các trò chơi điện tử Mọt tui không thể không nhớ đến cụm từ “uncanny valley”. Có thể nói uncanny valley là sự ám ảnh thường trực đối với cộng đồng game thủ và cả những nhà phát triển game nữa. Những ngày xa xưa khi đồ họa game còn là những chấm trắng đen sơ khai sự ám ảnh về “thung lũng kỳ quặc” không phải là một vấn đề to tát bởi phải rất cố gắng thì người ta mới hình dung được những chấm pixel ấy là thứ gì. Nhưng than ôi, vật đổi sao dời kể từ ngày đồ họa 3D chính thức phổ biến vào cuối thập niên 90, nỗi lo lắng về uncanny valley trở nên rõ ràng hơn bao giờ hết.
Vậy cụ thể thuật ngữ uncanny valley là gì? Chính xác thì uncanny valley mô tả về một cảm giác hay một hiệu ứng xảy ra trong tâm trí của mỗi người. Chúng xuất hiện khi một thứ gì đó không phải con người, nhưng lại sở hữu nhiều chi tiết giống người, nó sẽ trở nên rất hấp dẫn. Có điều, cũng chính tạo vật ấy khi trở nên quá giống con người nhưng không hoàn hảo 100%, đồng thời vẫn tồn tại những dấu vết không phải người, thì thái cực cảm xúc lại bị đảo ngược khi “thứ đó” khiến chúng ta cảm thấy sợ hãi.
Có thể lấy những con búp bê được tạo hình giống nhân loại làm ví dụ. Cụ thể nếu thấy một con búp bê có thể phát âm, liếc mắt, di chuyển, bạn sẽ cảm thấy thú vị hay chợt giật mình sao nó lại trông giống như… Annabelle thế này? Về mặt học thuật uncanny valley được định nghĩa bởi giáo sư Masahiro Mori vào năm 1970, thuật ngữ này miêu tả một phản ứng kỳ lạ và có phần tiêu cực trước những vật nhân tạo gần giống con người, như Robot hay các nhân vật game, hoạt hình.
Khi đó, Mori đang chế tạo một người máy theo khuôn mẫu của chính ông. Những người quan tâm ban đầu cảm thấy thích thú, nhưng dần dà khi nó càng ngày càng giống người hơn (thêm da nhân tạo, tóc và mắt giả, cảm xúc gương mặt…), họ lại thay đổi cảm xúc sang thái cực kinh sợ tạo vật của Mori. Ông ta cảm thấy thú vị về điều này nên đã bắt tay nghiên cứu sau đó đã lập ra một biểu đồ, và đặt cho nó cái tên “thung lũng kỳ quặc” như chúng ta đã biết. Miêu tả về hiệu ứng này thì đơn giản, nhưng để đi sâu vào trong đó thì là một chuyện hoàn toàn ngược lại. Kết quả, nó đã dấy lên một cuộc tranh luận không hồi kết về tính chân thực trong khả năng tồn tại hay đây chỉ là những cảm xúc nhất thời của não bộ và người ta nhầm lẫn rằng có một hiệu ứng thật sự xảy ra.
Vài năm trước đây Tim Sweeney từng phát biểu rằng cảnh quan môi trường sống động và chân thực trong trò chơi điện tử không phải là không có cơ sở thực tế nhưng điều kiện tiên quyết chính là nó cần một cỗ máy có khăng xử lý đến 40 TFlops[¹] để tái hiện điều đó ngoài đời thực. Theo lý thuyết một cặp RTX 2080 Ti khi đem ép xung có thể đạt mức 30 TFlops. Mặc dù mức giá của RTX 2080 Ti rất không tiện nghi và gần như nằm ngoài tầm với của đại đa số bình dân bá tánh thì đây cũng có thể là một dấu hiệu cho thấy những cỗ máy có khả năng tái hiện đồ họa game y như thật sẽ được bán đại trà, trong 10 năm tới chẳng hạn.
Timothy D. Sweeney là lập trình viên game nhưng được biết đến nhiều hơn với vai trò founder đồng thời giữ cương vị CEO tại Epic Games, Timothy cũng đã góp phần tạo ra Unreal Engine lừng danh.
Đó là một căn cứ có sức nặng hẳn hoi nếu bạn vui lòng nhớ rằng trước khi thế hệ console thứ 8 bắt đầu ra mắt vào cuối năm 2013, hầu như ai cũng nghĩ rằng để đạt công suất xử lý 1,84 TFlops là một vấn đề hơi bị nan giải. Kết quả thì sao? PS4 dễ dàng cán mức mà trước đó ai cũng cho rằng rất khó để một máy chơi game đại chúng có thể đạt được. Sự phát triển của công nghệ là rất khủng khiếp và nếu ai đó còn cho rằng nó không khoa trương đến vậy thì bạn có có biết vào năm 2018 hiệu năng đồ họa của máy tính bảng iPad Pro đã không phân cao thấp với một chiếc Xbox One hay chưa?

Tại sao Mọt tui lại nói về vấn đề hiệu năng đồ họa nhỉ? Là để cung cấp cho bạn một khả năng nhận thức cơ bản rằng, không sớm thì muộn đồ họa của trò chơi điện tử sẽ không khác biệt lắm nếu so sánh với một bộ phim điện ảnh và khi đó chúng ta nên làm gì với cảm giác uncanny valley đây. Đó là một nỗi lo có thực đã manh nha từ nhưng năm đầu thập niên 80 khi các tựa game có đồ họa dạng wireframe[²] như Elite ra đời. Những năm 90 chứng kiến sự ra đời của thiết bị chuyên dụng nhằm tăng tốc đồ họa 3D đã đẩy thanh báo động nỗi sợ cảm giác uncanny valley lên một mức “đáng quan ngại”. Tuy nhiên mọi tranh cãi chỉ chính thức bắt đầu nghiêm túc từ thời điểm 1995 đến hiện tại khi nền tảng đồ họa của trò chơi điện tử đã có những bước nhảy vọt hết sức kinh ngạc cả về hiệu ứng thị giác lẫn mức mộ mô phỏng thực tế.
Nhìn chung nhân loại bao gồm cả Mọt tui là một quần thể có suy nghĩ hết sức phức tạp và đôi khi bản thân từng cá thể chưa chắc hiểu mình đang mong đợi điều gì. Có lúc chúng ta tỏ ra rất rõ ràng và đơn giản với mong muốn của mình như xem một bộ phim hay, đọc một cuốn sách thú vị hay ngắm một khung cảnh gì đó tùy theo sở thích. Nhưng cũng có lúc chính bản thân chúng ta cũng không thể định nghĩa được trong tiềm thức đang thật sự mong muốn điều gì nữa. Đám game thủ là một ví dụ rõ ràng và cụ thể nhất khi họ từng rất vui vẻ với những phong cách đồ họa giả 3D như cel-shaded của Telltale’s The Walking Dead hay Borderland 2, những trò chơi tuy không quá xuất sắc về mặt đồ họa nhưng ai chơi xong cũng cho rằng chính kiểu đồ họa như vậy mới giúp họ cảm nhận hết những gì mà trò chơi muốn truyền tải.
Các nhà phát triển thường thì không có tâm nhưng đôi khi họ muốn chứng tỏ chút xíu trách nhiệm và muốn khách hàng có cảm nhận về hiệu ứng thị giác tốt hơn nên hướng đồ họa game vào lãnh địa photorealism[³], thế là họ ăn hành SML. Bạn đã thấy sự khó hiểu của nhân loại chưa? Khi đồ họa còn sơ sài thì họ chấp nhận với những gì đang có và chép miệng ước gì. Thế nhưng khi người ta nghiên cứu ra cách làm cho thế giới ảo chân thực hơn thông qua những tạo tác gần giống với nhân loại thì họ lại gào lên hãy đem thứ quái dị này cút đi bởi trông nó quá sức ám ảnh. Tất nhiên cũng có những game thủ không gặp vấn đề gì về cảm giác uncanny valley, nhưng lại cảm thấy hành vi cố gắng sao chép nhân loại của trí tuệ nhân tạo trông thật ấu trĩ và thừa thãi.
Trong những phi vụ trước đó về chuyện bỏ đi liêm sỉ để mà làm người của AI nhưng thất bại chúng ta có thể đếm được một danh sách hơi bị dài và tiêu biểu nhất chính là kiểu trò chuyện một chiều và đôi khi tỏ ra quá ngáo đá của AI trong Deus Ex: Mankind Divided. Ngoài đời thật, cuộc trò chuyện luôn xảy ra theo hướng đa chiều với sự tương tác qua lại giữa hai hay nhiều đối tượng. Bạn không thể nào bước ra đường và hét lên tôi không thích tiền sau đó 500 anh em đồng thanh đáp lại chúng tôi cũng vậy. Để làm được điều đó trừ phi bạn là một idol vạn người mê còn không kiểu gì cũng sẽ có người phản ứng lại theo kiểu tích cực lẫn tiêu cực. Deus Ex: Mankind Divided thì không như thế, khi nói chuyện với các NPC chúng sẽ chờ bạn nói sau đó chúng hùa theo như một thính giả trung thành chứ không bao giờ chủ động trao đổi về bất cứ điều gì, từ đó AI trông rất ngáo và cuộc trò chuyện trở nên hết sức kém thuyết phục.
Vấn đề của Deus Ex: Mankind Divided chính là đồ họa của nó quá chân thực, chân thực đến nỗi khi chạy ở độ phân giải 4K và bật chế độ PureHair những nhân vật được lập trình này trông chẳng khác nhân loại là mấy và thế là chúng bị người ta xa lánh vì cảm giác uncanny valley. AI thì bị các game thủ gan to chê là ngáo khi xử lý tình huống trong khi tạo hình đồ họa lại bị những tay yếu bóng vía ghét bỏ vì giống người nhưng hóa ra không giống, quả nhiên các NSX Deus Ex: Mankind Divided khi phát hành game đã không xem ngày cẩn thận rồi. Nhưng nói gì thì nói, chính những vấn đề mà trò chơi gặp phải đã gợi ý cho chúng ta một bức tranh sợ bộ về tương lai có thể xảy ra của ngành công nghiệp game, khi đồ họa ngày càng giống thật nhưng trí tuệ nhân tạo lại không cách nào phát triển kịp với tốc độ phi mã đó.
Chúng ta đã từng không dưới một lần nghe đến nhưng cụm từ như công nghệ nắm bắt chuyển động của ánh mắt, thuật toán nhận dạng khuôn mặt hay vài thứ tương tự như vậy có liên quan đến biểu cảm khuôn mặt của con người. Tuy nhiên những công nghệ này dường như chỉ loanh quanh trong biên giới của các ứng dụng OTT như Snapchat hay FaceID, còn game hình như chưa thấy sử dụng bao nhiêu. Một trong các vấn đề lớn nhất khi nói về cảm giác uncanny valley chính là biểu cảm thiếu chân thật lẫn sức sống trên gương mặt của các mô hình đồ họa. Nếu các công nghệ nói trên có thể giúp một tay thì sao nhỉ? Nhìn chung đây là một môn học thuật chuyên ngành cao thâm có liên quan hơi bị nhiều đến artificial emotional intelligence* (AEI) hay cảm xúc của trí tuệ nhân tạo và hồi xưa Mọt tui cúp học hơi nhiều nên cái món đồ chơi này cũng không phải rất là rành nhưng theo hiểu biết còn thô thiển của bản thân tui thấy hai thứ này chắc chắn có khả năng bổ trợ cho nhau.
Emotional intelligencethường được dùng dưới hàm nghĩa nói về chỉ số cảm xúc (emotional intelligence quotient – EQ) của mỗi cá nhân. Chỉ số này mô tả khả năng, năng lực, kỹ năng hay khả năng tự nhận thức để xác định, đánh giá và điều tiết cảm xúc của chính mỗi người, của người khác, của các nhóm cảm xúc.
Ngày nay đồ họa của các trò chơi điện tử đã ngày càng tiến gần đến giới hạn nguy hiểm của photorealism và sự tiêu cực từ cảm giác uncanny valley cũng ngày một lộ rõ hơn. Thế nhưng theo cách lạc quan nhất thì chúng ta nên tin rằng với sự phát triển vượt bậc của công nghệ, ca lệch pha này sẽ nhanh chóng được giải quyết mà thôi bởi có một thực tế rằng game là một ngành công nghiệp hái bộn tiền và mấy ông công ty game giàu sụ sẽ chẳng bao giờ để khách hàng của mình từ bỏ chơi game chỉ bởi vì trò chơi giống thật nhưng trông nó ám ảnh quá!
Chú thích:
[¹] Trong máy tính, FLOPS (FLoating-point Operations Per Second) là một thước đo hiệu suất máy tính, đặc biệt là trong lĩnh vực tính toán khoa học sử dụng nhiều các tính toán thập phân trong một giây. 1 TFlops hay 1 teraflops là một nghìn tỷ con tính trong một giây, thường dùng để đo sức mạnh của bất kỳ hệ thống siêu máy tính nào.
[²] Wireframe là thiết kế đồ họa giả 3D dạng khung dây sơ khai của trò chơi điện tử, về sau này khi làm đồ họa 3D các họa sĩ thường vẽ ra khung wireframe trước để định hình cấu tạo cũng như kích thước của vật thể.
[³] Photorealism là thể loại nghệ thuật bao gồm hội họa, tranh vẽ tay cùng các phương tiện có liên quan đồ họa khác. Trong photorealism, một nghệ sĩ sẽ nghiên cứu một chủ thể có thực sau đó cố gắng tái tạo hình ảnh một cách chân thực nhất có thể bằng một phương tiện khác.