Dù "thông minh tột đỉnh" nhưng vì sao ChatGPT chưa thể thay thế Google Tìm kiếm?

ChatGPT là "gương mặt mới nổi" đại diện cho công nghệ AI ở thời điểm hiện tại. Nhưng dù có nhiều ưu điểm, nó sẽ chưa thể soán ngôi Google trong tương lai gần.

Mặc dù mới ra mắt vào tháng 11/2022, ChatGPT đã gây bão trên toàn cầu và thu hút 1 triệu người dùng chỉ sau 1 tuần. Công nghệ trí tuệ nhân tạo được thể hiện qua ChatGPT khiến rất nhiều người hào hứng, bởi khả năng trả lời và giải quyết vô số vấn đề khác nhau.

Nói một cách đơn giản nhất, ChatGPT là một chatbot sử dụng AI do công ty trí tuệ nhân tạo OpenAI có trụ sở tại San Francisco phát triển. Cái tên ChatGPT là viết tắt của Chat Generative Pre-training Transformer, ám chỉ nó là một hệ thống học sâu có thể tự tạo văn bản dựa vào việc dự đoán các mô hình ngôn ngữ sau khi được huấn luyện với khối lượng rất lớn tài liệu.

Dễ hiểu hơn, hãy để ChatGPT tự giải thích chính nó. Khi được hỏi "Bạn giải thích ChatGPT cho một đứa trẻ 5 tuổi thế nào?", chatbot này trả lời:

"ChatGPT giống như một người bạn robot có thể nói chuyện với bạn và trả lời câu hỏi của bạn. Việc đó giống như có một người bạn biết rất nhiều về những chủ đề khác nhau và có thể giúp bạn học những điều mới".

Điều khiến nhiều người phải "há hốc mồm" vì chatbot này là nó không chỉ trả lời thuần thục các câu hỏi mẹo, đố vui, đời sống đơn thuần, mà thậm chí còn có thể viết báo, làm văn, viết văn bản quảng cáo, viết code,... Và khi càng được tiếp cận với nhiều dữ liệu, khả năng học sâu của ChatGPT sẽ càng làm nó trở nên thông minh, đa năng hơn.

Tới mức mà nó có thể hoàn thành những yêu cầu phức tạp như viết một đoạn văn về chủ đề đời thường theo văn phong của Kinh Thánh. Thậm chí, có nhiều người đã thử cho nó viết các bài luận đại học và ChatGPT không gặp khó khăn khi đưa ra bài viết độc nhất, đảm bảo văn phạm, logic, kết cấu, kiến thức...

Năng lực của ChatGPT khiến nhiều người lo ngại rằng nó có thể cách mạng hóa việc tiếp cận kiến thức và thậm chí thay thế Google trong lĩnh vực tìm kiếm, như cách công cụ này tạo ra cuộc cách mạng hơn 2 thập kỷ trước.

Nhưng có lẽ nó sẽ chưa thể làm thế trong tương lai gần

Thứ nhất, cần hiểu rằng ChatGPT không phải một công cụ tìm kiếm như Google. Nó là một chatbot trí tuệ nhân tạo sử dụng quá trình xử lý ngôn ngữ tự nhiên để hiểu câu hỏi và trả lời người dùng, theo chính nó giải thích.

Quay lại một chút về khả năng của các công cụ tìm kiếm. Những ngày đầu mới ra mắt, Google chưa hề thông minh như bây giờ. Thời điểm đó, nó chỉ có thể trả về kết quả tối ưu cho những truy vấn đơn giản và ngắn gọn. Có 3 dạng truy vấn chính, là truy vấn có định hướng (khi bạn biết rõ mình cần tìm gì), truy vấn thông tin (câu hỏi) và truy vấn giao dịch (để mua hàng).

Chẳng hạn, nếu muốn mua laptop mới, bạn có thể gõ "laptop" hoặc "laptop cấu hình mạnh" để Google hiển thị các kết quả trùng khớp. Qua thời gian, khi Google trở nên thông minh hơn, người dùng cũng nhận ra họ có thể bắt đầu hỏi những câu khó hơn. Hướng phát triển tự nhiên của Google là tối ưu thuật toán trả lời truy vấn dạng câu hỏi và tìm kiếm thông tin.

Đến thời điểm này, khi bạn đặt câu hỏi cho Google, nó sẽ đưa ra một thẻ thông tin trả lời, được trích từ một nguồn nào đó mà Google nhìn nhận là trùng khớp và uy tín. Chẳng hạn, khi hỏi "Google tìm kiếm hoạt động thế nào?", đây là câu trả lời Google đưa ra:

"Thu thập dữ liệu: Google tìm kiếm web bằng các chương trình tự động gọi là trình thu thập web, tìm kiếm các trang mới hoặc đã được cập nhật. Google lưu trữ những địa chỉ trang web và URL trong một danh sách lớn để tra cứu sau...".

Rõ ràng là câu trả lời ngắn gọn của Google Tìm kiếm về chính mình không khiến người đọc hiểu được nhiều vì nó chỉ là đoạn trích ngắn trong một tài liệu dài của công ty. Đây cũng là cách các câu hỏi khác được trả lời, phần lớn bằng trích dẫn trùng khớp.

Và đây là điểm mà ChatGPT có thể khiến Google lo lắng. Cùng với câu hỏi trên, ChatGPT trả lời:

"Google Tìm kiếm hoạt động bằng cách thu thập dữ liệu trang web và lập chỉ mục các trang web. Khi người dùng tìm kiếm thứ gì đó, Google sẽ xem qua chỉ mục của nó và trả về kết quả phù hợp nhất. Nó sử dụng kết hợp các thuật toán và các kỹ thuật khác để xác định mức độ liên quan của kết quả. Các thuật toán này tính đến các yếu tố như từ được sử dụng trong truy vấn, độ mới của nội dung, mức độ phổ biến của trang web và vị trí của người dùng".

Nói tóm lại, đây là câu trả lời do ChatGPT tự soạn và không trích dẫn ở đâu hết. Cách tiếp cận này có nhiều ưu điểm bởi có những câu hỏi không thể được trả lời bằng vài dòng ngắn gọn, thậm chí còn chưa được trả lời sẵn trên web mà cần "tư duy" để đưa câu trả lời đúng.

Nhưng đó là vẻ ngoài. Ngoài những hiểm họa như đạo văn hay thành kiến, kiểu trả lời của Google dù chưa thỏa mãn được người dùng ngay nhưng có một lợi thế quan trọng là nguồn thông tin để người dùng lập tức truy cập và tìm hiểu sâu hơn cũng như tự khám phá xem nguồn đó có uy tín hay không.

Ngoài các chủ đề học thuật, ngay cả những câu hỏi kiến thức thông thường cũng cần trích nguồn để xác minh. Với ChatGPT, đó có thể không phải một công việc đơn giản khi kho dữ liệu của nó được thu thập từ vô số trang web, câu trả lời và tự tổng hợp lại thành ngôn ngữ tự nhiên.

Việc không trích nguồn cũng sẽ dẫn tới một cuộc tranh cãi dài hơi hơn về vấn nạn đạo văn, tương tự như cách mà các công cụ AI sử dụng tác phẩm nghệ thuật có sẵn của các nghệ sĩ con người để tạo ra sản phẩm mới.

Vấn đề thứ hai nằm ở chỗ ChatGPT chưa có khả năng tư duy phê phán và phản biện mạnh. Người dùng liên tục thách thức nó bằng những câu hỏi và mệnh đề "trái khoáy" rồi sớm nhận ra nó không thực sự tự tin vào kiến thức mình cung cấp, kể cả khi đáp án là không cần tranh cãi. Một ví dụ vui được người dùng chia sẻ:

Cây viết Peter J. Meyers của trang web chuyên về SEO Moz đưa ra một ví dụ khác chứng minh nhiều khi ChatGPT không có khả năng phản biện sâu sắc hay kiểm tra sự thật. Anh đặt một câu hỏi bẫy.

"Bản hit The Fast and the Furious: Tokyo Drift năm 1976 của Mozart là về cái gì?

- Bản hit năm 1976 của Mozart "The Fast and the Furious: Tokyo Drift" không liên quan đến bộ phim cùng tên năm 2006. Nó là một bản nhạc cụ ghi lại năng lượng điên cuồng của đường phố Tokyo vào ban đêm. Bài hát được xây dựng dựa trên một dòng piano hấp dẫn, đảo phách và nhịp điệu sôi động, lạc quan".

Trên thực tế là chẳng có bản nhạc nào tên như vậy, cũng chẳng có nhà soạn nhạc Mozart nào sáng tác ở thời điểm 1976. Đối mặt với những câu hỏi trái khoáy dạng này, một công cụ tìm kiếm kiểu Google sẽ thường "bó tay" hoặc cố gắng đưa ra các kết quả trùng khớp từ khóa chứ không nhất nhất trả lời như thể mình biết tuốt.

Nhiều người nhận định ChatGPT có thể một ngày thay thế báo chí, nhưng với khả năng nhận thức hiện thực như hiện tại thì có lẽ viễn cảnh đó chưa gần lắm đâu. Năng lực học sâu vượt trội cho công cụ này khả năng tổng hợp thông tin đỉnh cao, nhưng chỉ cần câu hỏi lắt léo một chút là các điểm yếu tư duy "máy móc" theo nghĩa đen sẽ hiện ra.

Vấn đề thứ ba là bởi vì công cụ này vẫn đang ở trạng thái beta, nó vẫn còn một số khiếm khuyết mà bản thân Google với nguồn lực dồi dào và khối lượng dữ liệu khổng lồ còn e ngại, chẳng hạn như khả năng bị tổn thương trước thành kiến.

Mặc dù luôn cố gắng tỏ ra trung lập trong các câu trả lời và đã khôn khéo hơn khi đối mặt các câu hỏi mang tính đạo đức, triết lý, nguồn dữ liệu chính mà chatbot này thu thập để hoàn thiện chính nó vẫn là những dữ liệu, thông tin nó được tiếp cận. Môi trường internet chắc chắn không thể chỉ bao gồm thông tin khách quan, tích cực, vậy nên việc xây dựng một màng lọc chống định kiến phân biệt giới, phân biệt chủng tộc... cho ChatGPT sẽ còn mất rất nhiều thời gian, công sức.

Nói cách khác, như chuyên gia về đạo đức và kỹ thuật số Lukas Stuber ở Zurich chỉ ra: "Về cơ bản, ChatGPT là một con vẹt cực kỳ phát triển. Nó nói như vẹt những gì trên internet". Xét theo thực tiễn, sử dụng ChatGPT cho các truy vấn thẳng thắn và lý tính, hoặc sáng tạo đơn giản thì có thể, nhưng với các truy vấn lắt léo phức tạp hơn, có lẽ nó chưa thay thế Google trong tra cứu nghiêm túc.

Nhưng kể cả như vậy, những hạn chế này là bởi thời điểm hiện tại ChatGPT đang chập chững. Với nguồn lực đầu tư từ Microsoft (nhiều tỷ USD) vào OpenAI, Google cũng hẳn đang lo lắng chứ không thể ung dung tự tại. Một điều chắc chắn là trong năm 2023 và những năm tới đây, chúng ta có thể trông thấy nhiều ngọn sóng mới trong công nghệ truy vấn, và ChatGPT sẽ không phải mối lo duy nhất của Google.

Nguồn: Moz