Liệu các trợ lý ảo có nên cố gắng giống con người?
Ngày nay, trợ lý ảo hay giao diện thoại (voice user interfaces) đang cố gắng để có những hội thoại giống con người hơn, liệu đây có phải là lựa chọn đúng đắn?
Dù giao diện đồ họa (graphical user interfaces) đã đóng vai trò chính trong việc giao tiếp và xử lý tác vụ trên nên tảng số trong suốt bốn thập kỷ qua. Tuy nhiên, nó cũng đang dần thoái trào với sự nổi lên của công nghệ mới là giao diện thoại.
Vốn được mô phỏng theo hội thoại giữa con người, giao diện thoại tương tác với người dùng qua giọng nói. Những công ty công nghệ như Microsoft, Google,.. đã và đang tập trung phát triển những giao diện thoại để nó giống người hơn, được chấp nhận hơn. Dù định hướng ấy nghe thật hấp dẫn nhưng vẫn có những lo ngại cho nó.
Khoảng trống kỳ vọng
Tương tự như giao diện đồ họa, người dùng khi sử dụng giao diện thoại cũng có những giả định và kỳ vọng về khả năng của giao diện. Từng có nghiên cứu về chỉ ra tương tác thực với giao diện thoại không khớp với nhiều kỳ vong của người dùng. Ví dụ như cảm giác khó chịu khi đối diện với một thứ cố gắng giống con người nhưng lại không có tương tác thật như người. Cảm giác khó chịu này có thể giảm trải nghiệm người dùng, hạn chế các tương tác tiếp theo với giao diện ấy.
Giao diện đồ họa giao tiếp thông qua nhiều hình ảnh, nhưng giao diện thoại lại chỉ có thể tương tác qua giọng nói. Trong nhiều trường hợp, việc này gây khó khăn cho người dùng bởi họ không có nhiều tùy chọn, khiến họ có xu hướng bỏ nhiệm vụ. Khi xảy ra sai sót về chức năng, nó cũng sẽ khó được chấp nhận hơn so với lỗi của giao diện đồ họa.
Bắt trước con người và lấy cảm hứng từ con người
Dù giao diện thoại giúp cải thiện trải nghiệm người dùng và mang lại lợi ích, tuy nhiên, nó không nhất thiết phải là mục tiêu cuối cùng. Dù đã có những tổ chức tuyên bố tương tác giữa giao diện thoại với con người sẽ giống như của con người với con người. Tuy nhiên, nghiên cứu gần đây cho thấy người dùng coi mối quan hệ ấy là mối quan hệ không bình đẳng, mang tính chủ-tớ. Những hạn chế về tương tác của giao diện thoại sẽ đòi hỏi các công ty cải tiến hoặc thay đổi hướng tiếp cận.
Nhận thức của người dùng về tương tác con người rất phức tạp, đa chiều và mỗi chiều phải được giải quyết theo cách khác nhau. Giao diện thoại được phát triển với đặc điểm của con người, nó tạo ra một kỳ vọng rằng mọi tương tác của nó đều sẽ giống người. Khi giao diện thoại không thể đáp ứng được kỳ vọng ấy, tương tác người dùng sẽ giảm. Do đó, điều chúng ta nên cân nhắc là phát triển các tương tác cộng hưởng giữa giọng nói, hành vi và hình ảnh, để chúng có thể hỗ trợ lẫn nhau và tạo thành một trải nghiệm tối ưu hơn.
Nghiên cứu chỉ ra người dùng trải nghiệm giao diện thoại theo nhiều cách khác nhau, vậy nên chúng ta có thể lấy nó làm nguồn cảm hứng để cải tiến giao diện. Đồng thời, nghiên cứu cũng chỉ ra người dùng đánh giá sự kết hợp giữa âm thanh IPA và hình ảnh trong tương tác giúp giao diện trở nên giống người hơn. Bởi vậy, việc nghiên cứu và phát triển giao diện thoại trong tương lai có thể từ bỏ mục tiêu bắt chước con người, thay vào đó tạo ra tương tác kết hợp hoặc độc lập.
Mục tiêu, bối cảnh và tình huống
Mặt khác, trong việc phát triển nhận thức cho người dùng, giọng nói tự nhiên được chứng minh là kém hơn với giọng nói tổng hợp. Nhưng như vậy không có nghĩa là giọng nói tự nhiên không hữu ích. Giọng nói tự nhiên, giống con người sẽ phù hợp cho những cuộc đối thoại dài. Ví dụ những ngành như chăm sóc sức khỏe, cộng đồng, sẽ cần những tương tác như vậy. Ngược lại, giọng nói tổng hợp không giúp ích xây dựng mối quan hệ nhưng nó phù hợp với những hành vi mua hàng, bảo mật, những hành vi đòi hỏi sự chú ý, kiểm soát để hoàn thành.
Theo suchman, giao tiếp giữa con người đòi hỏi nhiều kiến thức về bối cảnh và tình huống và việc đưa những nhận thức này vào máy móc là rất khó. Ví dụ như trợ lý ảo Amazon Echo, chủ yếu được sử dụng tại nhà nên nó phải đối mặt với vấn đề trong việc hiểu các quy tắc xã hội. Hiểu chuẩn mực xã hội là yếu tố quan trọng trong giao tiếp của con người, việc giao diện không đáp ứng được nó sẽ tiếp tục tạo ra thất vọng.
Tương lai của giao diện thoại
Với khả năng của công nghệ, trong sớm muộn, giao diện thoại sẽ trở nên phổ biến. Theo đó, tính năng, tương tác và cả kỳ vọng cho nó cũng có thể thay đổi. Cho tới lúc ấy, chúng ta vẫn phải giải quyết những rào cản trước mắt, tạo ra một trải nghiệm tích cực hơn. Dù việc dùng giọng con người có thể giải quyết một số thách thức thiết kế, nhưng nó không phải là giải pháp tốt cho mọi trường hợp. Điều chúng ta nên làm đó là đánh giá vai trò của giao diện thoại với đời sống con người, từ đó đưa ra lựa chọn dựa trên bối cảnh và mục đích.