ChatGPT có thể đọc được nét mặt của đối tác?

OpenAI tiết lộ đã nâng cấp ChatGPT giống con người hơn bao giờ hết. Bản nâng cấp mới nhất của ChatGPT về trợ lý giọng nói giờ đây có thể phản hồi các đầu vào âm thanh, văn bản và hình ảnh trong thời gian thực.

Màn hình điện thoại hiển thị GPT-4o

ChatGPT-4o sẽ được triển khai cho những người thử nghiệm trong vài tuần tới.

Phiên bản mới của ChatGPT có thể đọc được nét mặt, bắt chước mẫu giọng nói của con người và thực hiện các cuộc trò chuyện gần như thời gian thực, những người tạo ra nó vừa tiết lộ.

OpenAI đã trình diễn phiên bản sắp tới của chatbot trí tuệ nhân tạo (AI), được gọi là GPT-4o, trong một bài thuyết trình theo thời gian thực. Chatbot, nói với người thuyết trình qua điện thoại, dường như có một mệnh lệnh kỳ lạ về cuộc trò chuyện của con người và các tín hiệu cảm xúc tinh tế của nó – chuyển đổi giữa giọng nói của robot và giọng hát theo lệnh, thích ứng với các gián đoạn và xử lý trực quan các nét mặt và môi trường xung quanh.

Trong cuộc trình diễn, trợ lý giọng nói AI đã thể hiện các kỹ năng của mình bằng cách hoàn thành các nhiệm vụ như dịch ngôn ngữ theo thời gian thực, giải phương trình toán học viết trên một tờ giấy và hướng dẫn người mù quanh đường phố London.

Sam Altman, Giám đốc điều hành của OpenAI, đã viết trong một bài đăng một từ trên nền tảng truyền thông xã hội X sau khi bài thuyết trình kết thúc. Bài đăng liên quan đến bộ phim cùng tên năm 2013, trong đó một người đàn ông cô đơn phải lòng một trợ lý AI.

Để thể hiện khả năng đọc tín hiệu thị giác, chatbot đã sử dụng ống kính camera của điện thoại để đọc nét mặt của một kỹ sư OpenAI và mô tả cảm xúc của họ.

Các khả năng mới này là một cải tiến lớn so với các tính năng giọng nói hạn chế trong các mẫu trước đây— vốn không có khả năng xử lý các gián đoạn hoặc phản hồi thông tin hình ảnh.

Mira Murati, giám đốc công nghệ của OpenAI, cho biết tại cuộc họp báo: “Chúng tôi đang hướng tới tương lai của sự tương tác giữa con người và máy móc. Chúng tôi nghĩ GPT-4o đang thực sự thay đổi mô hình đó”.

Trợ lý giọng nói mới dự kiến sẽ được phát hành ở dạng giới hạn cho những người thử nghiệm alpha trong những tuần tới, sau đó là triển khai rộng rãi hơn sẽ bắt đầu bằng việc trả tiền cho những người đăng ký ChatGPT Plus.

Thông báo này cũng theo sau báo cáo của Bloomberg rằng công ty sắp đạt được thỏa thuận với Apple để tích hợp ChatGPT trên iPhone – mở ra khả năng GPT-4o có thể được sử dụng để nâng cấp Siri, trợ lý giọng nói của iPhone.

Tuy nhiên, công nghệ mới này cũng làm dấy lên những lo ngại về tính an toàn và việc thực hiện các cuộc gọi điện thoại lừa đảo.

Theo Báo Tiền Phong