Thời của giao diện người dùng thông minh

Giao diện người dùng đã phát triển trong khoảng thời gian dài và chúng đang có nhiều biến đổi nhờ vào sự bùng nổ của các xu hướng công nghệ như trí tuệ nhân tạo, thực tế ảo,…

Sự phát triển của giao diện người dùng

Thế hệ giao diện người dùng máy tính đầu tiên trong những năm 1950 và 1960 đòi hỏi con người phải nhập dữ liệu theo thẻ đục lỗ hay băng từ. Giao diện người dùng thế hệ thứ 2 được biết đến với những dòng lệnh (Command Line Interfaces - CLI), vẫn đòi hỏi người dùng phải am hiểu hệ thống cùng các lệnh và cú pháp phức tạp. CLI có hiệu quả cao đối với quản trị viên hệ thống và nhà phát triển nhưng chúng vẫn chưa thân thiện với phần lớn người dùng cuối.

Thiết bị trung gian để giao tiếp giữa người vận hành và máy móc thiết bị - Human Machine Interface (HMI) không còn là duy nhất trong thời đại ngày nay. Được thiết kế hồi năm 1973 bởi Xerox PARC, HMI được kỳ vọng là công cụ giúp người dùng có thể kiểm soát, vận hành mọi thiết bị máy móc, những câu lệnh phức tạp được biến thành những nút bấm để mọi thứ trở nên dễ dàng hơn.

Cảm ứng trên lò viba của bạn là một HMI, hệ thống số điều khiển trên máy giặt, bảng hướng dẫn lựa chọn phần mềm hoạt động từ xa trên TV đều là HMI, có thể nói điện thoại cảm ứng hiện nay cũng là thiết bị HMI theo nghĩa rộng.

Suốt một thời gian dài, mô hình giao diện đồ họa người dùng (Graphical User Interface - GUI) đã làm rất tốt công việc của mình. Hầu hết mọi tương tác với máy móc, liên quan đến tính toán tốc độ cao và xử lý ngôn ngữ, các tác vụ có thể được thực hiện bằng bàn phím và cảm ứng như trong khoảng thời gian gần đây.

Ngày nay, hầu hết mọi người tương tác với giao diện người dùng thứ ba: giao diện đồ họa cho phép mọi người điều hướng trên màn hình bằng cách nhấp vào một đối tượng trên màn hình. Cho dù đó là Mac hồi năm 1984 hay Windows 10 mới nhất, trải nghiệm người dùng không thay đổi nhiều.

Sự tương tác giữa người dùng và giao diện đồ họa người dùng là trực quan, và khá dễ dàng sử dụng. Tuy nhiên tốc độ tương tác diễn ra chủ yếu phụ thuộc vào người dùng. Chúng ta thiếu nhận thức về ngữ cảnh và các mô hình tương tác năng động hơn. Làn sóng giao diện người dùng thứ tư kết hợp các yếu tố này để đạt được mức năng suất mới.

Thời của giao diện người dùng thông minh

Chuột máy tính, giao diện người dùng đồ họa, siêu văn bản và xử lý văn bản vào những năm 1968

Những ví dụ sớm nhất về cái được gọi là giao diện người dùng thông minh (Intelligent User Interface – IUI) đã xuất hiện trong cộng đồng Hệ thống dạy học thông minh (ICAI) vào những năm 1960 - 1970 và trở nên phổ biến trong giới khoa học những năm 1980. Cùng khoảng thời gian này, các chuyên gia về AI đã tạo ra nhiều giao diện người dùng dựa trên trí tuệ nhân tạo, đáng chú ý như hệ thống “WIZARD”. Một trong IUI được phổ cập rộng rãi và sớm nhất đó chính là Clippy – một trợ lý ảo mà chúng ta đã được thấy trong Microsoft Office.

Vào năm 2018, chúng ta sẽ thấy sự gia tăng của giao diện người dùng thông minh với điện toán giác quan - một nền tảng điện toán đã đưa công nghệ ra khỏi những cái vỏ hộp và đi vào thế giới thực. Sự kết hợp của trí tuệ nhân tạo, học máy, cảm biến và robot cho phép các công nghệ này có khả năng tự nhận thức và điều hướng thế giới thực cũng như hành động một cách thông minh thay mặt cho chúng ta.

Điều này phần lớn là nhờ vào bước đột phá trong việc học máy – machine learning. Không giống như các mô hình học thuật học trước đây, học máy sử dụng mạng nơ ron theo lớp để học từ các ví dụ. Kết quả là, học máy vượt qua khả năng của con người khi được cung cấp với bộ khung quy định cụ thể.

Ví dụ, khả năng quan sát của máy đã vượt qua con người trong nhận dạng hình ảnh. Nó mạnh mẽ đến mức Google đã tạo ra một AI có khả năng phát hiện ung thư nhanh hơn con người.

Trên thực tế, bất cứ khi nào chúng ta tập trung cho máy học từ những ví dụ của con người, chúng ta nhanh chóng xây dựng một hệ thống kiến thức với tốc độ không tưởng và tính logic mà con người không bao giờ có thể có được. Đối với học máy thì dữ liệu càng cụ thể theo ngữ cảnh thì càng trở nên nhanh chóng và chính xác. Nhưng ngược lại nếu không có ngữ cảnh thì cũng không có học máy.

Bởi vì các mô hình khác nhau đến từ các nguyên tắc khác nhau, sự phát triển của giao diện người dùng là một công việc đa ngành. Trí tuệ nhân tạo đóng góp các kỹ thuật mô phỏng thông tin để cải thiện giao tiếp, Kỹ thuật Phần mềm đóng góp các quá trình thống nhất, các ký hiệu và ngôn ngữ chính thức. Cuối cùng, sự tương tác giữa con người và máy tính góp phần quan tâm đến người dùng, và do đó là các kỹ thuật để tạo ra các giao diện người dùng có thể sử dụng được.

Thực tế ảo (VR) và thực tế ảo tăng cường (AR) có gốc từ game, nhưng những người ủng hộ công nghệ ảo lại kì vọng nó sẽ chuyển từ game sang những ứng dụng phổ thông và ứng dụng trong đời sống nhiều hơn. Trong đó, thực tế ảo tăng cường là lớp đầu vào của người dùng cho điện toán nhận thức và cho phép chúng ta tiếp xúc trực tiếp vào những vấn đề thế giới thực cần giải quyết.

Thay vì hướng dẫn người dùng thông qua giao diện, chúng ta có thể hướng dẫn kỹ thuật để giải quyết vấn đề.

Ví dụ: chúng ta có thể nhận được bản dịch thời gian thực bằng Google Translate chỉ đơn giản bằng cách chọn một ngôn ngữ khác. Hay như sử dụng Blippar - một ứng dụng được mệnh danh là "Wikipedia về thế giới thực" có thể xác định những vấn đề được chúng ta chỉ định trong thế giới thực và tự động nhận được thông tin về nó.

Nhưng AR không phải là công cụ duy nhất mang đến giao diện người dùng thông minh trong năm 2018. Trong suốt thập kỷ qua, chúng ta đã thấy sự bùng nổ của giao tiếp bằng giọng nói giữa người và máy. Tính đến hiện tại, công nghệ nhận dạng tiếng nói đã bắt đầu đạt ngưỡng đủ tốt để người dùng chấp nhận, không chỉ trên nền tảng của Goolge, mà các hãng công nghệ (và nền tảng của họ) đều đã đạt được ngưỡng nhận dạng từ (Word Accuracy Rates) chính xác hơn 90%.

Hai yếu tố chính để việc sử dụng giao diện giọng nói thực sự bùng nổ là hệ thống đạt được độ chính xác trong việc nhận dạng và hiểu ngôn ngữ ở ngưỡng 99%, đồng thời giảm độ trễ (latency) trong việc phản hồi của hệ thống. Các hệ thống giao diện giọng nói đang gần tiến đến ngưỡng này, ví dụ như sản phẩm Amazon Echo, gần đây đã cải thiện được độ trễ từ lúc người dùng ra lệnh cho đến lúc Echo phản hồi từ khoảng 9 giây xuống còn 1,5 giây.

Một nghiên cứu gần đây của Accenture PLC - công ty tư vấn quản lý chuyên cung cấp dịch vụ chiến lược, tư vấn, kỹ thuật số, công nghệ và hoạt động đã trích dẫn một ví dụ điển hình về nơi AI đang thực hiện bước đột phá đầu tiên vào UI (giao diện người dùng) doanh nghiệp và UX (trải nghiệm người dùng) chính là các hệ thống kích hoạt bằng giọng nói. Các tiến bộ trong xử lý ngôn ngữ tự nhiên và học máy làm cho công nghệ trực quan hơn trong cách sử dụng, như trò chuyện với các trợ lý ảo để sắp xếp một cuộc họp thay vì truy cập vào phần mềm lập lịch để tìm thời gian, tạo ra một sự kiện và gõ nội dung. AI đã đóng vai trò khác nhau trong suốt trải nghiệm của người dùng. Trong cấp độ đơn giản nhất, nó chỉ đạo nội dung cho mọi người, như ứng dụng Spotify đưa ra các tư vấn về lựa chọn âm nhạc dựa trên những nghe trước đó. Trong vai trò quan trọng hơn, AI áp dụng việc học máy để hướng dẫn hành động hướng tới kết quả tốt nhất.

Các nhà cung cấp công nghệ hàng đầu của các công ty cũng đang tìm kiếm AI như là tương lai của các giao diện máy tính từ Salesforce Einstein, tới Microsoft Azure Cognitive Services, đến Google Cloud Platform. Ngoài ra còn có các nền tảng mã nguồn mở như TensorFlow của Google hay Trusted Analytics của Intel. Còn phải kể đến Caffe – một dự án framework về học sâu được phát triển tại Đại học California, Berkeley, là cơ sở của dự án Deep Dream Google trình làng hồi năm 2016 để chứng minh mạng thần kinh nhân tạo của họ đã có thể tự quan sát hình ảnh.

Trong phát triển sản phẩm phần mềm, giao diện người dùng cũng là một phần không thể tách rời, xu hướng chiếm ưu thế từ một vài năm trước đây là Phát triển giao diện người dùng dựa trên mô hình (MB-UID). Phương thức phát triển này chỉ ra cách mô tả các mô hình đặc tả các đặc tính của người sử dụng, các nhiệm vụ, bối cảnh sử dụng, và giao diện người dùng ở các mức trừu tượng khác nhau. Tất cả các mô hình này thường được lưu trữ trong ngôn ngữ mô tả giao diện người dùng dựa trên XML. XML đã trở thành một ngôn ngữ chính thống được sử dụng để phát triển giao diện người dùng thông minh. Ngoài ra, các ngôn ngữ mô tả các giao diện người dùng khác như XIML2 hoặc UIML3 cũng được sử dụng khá nhiều.

Nhưng chỉ dựa vào công nghệ thôi là chưa đủ, doanh nghiệp muốn phát triển giao diện người dùng thông minh cần phải: sử dụng các kênh truyền thông hiện tại và xác định cách thức thực hiện thông minh hơn bằng cách sử dụng cảm hứng từ các giao điện thoại; tập trung vào mỗi tương tác của khách hàng và nhân viên để tìm ra câu trả lời tốt nhất từ AI; doanh nghiệp cần mở rộng hơn các khái niệm mới, các giao diện mới mà không phải tương tác từ màn hình và và xem xét các kênh mới có thể cho phép đàm thoại đa chiều như thế nào.

Báo cáo của Accenture chỉ ra rằng, trong 5 năm tới hơn một nửa khách hàng sẽ lựa chọn dịch vụ dựa trên AI thay vì thương hiệu truyền thống của doanh nghiệp. Trong 7 năm, hầu hết các giao diện sẽ không có màn hình và sẽ được tích hợp vào công việc hàng ngày. Và trong 10 năm nữa, các trợ lý kỹ thuật số được phổ cập đến mức chúng sẽ có năng suất làm việc 24/7/365, hoạt động trong bối cảnh tương tác ở nơi làm việc, như tạo ra các bản tóm tắt video ngay sau một cuộc họp quan trọng…

PC WORLD VN, 02/2018