OpenAI GPT-4o: Trợ lý giọng nói đột phá, các tính năng thị giác mới và mọi thứ bạn cần biết

ChatGPT có mô hình mới, trợ lý giọng nói được nâng cấp và dành nhiều tình cảm hơn cho người dùng miễn phí

OpenAI đã tổ chức sự kiện Spring Update trực tiếp ngày 14/05/2024 và nó đã vượt qua cả dự đoán về “phép thuật”, ra mắt model GPT-4o mới cho cả phiên bản miễn phí và trả phí của ChatGPT, trợ lý giọng nói có âm thanh tự nhiên và mang tính cảm xúc cùng các khả năng về thị giác.

Vẫn còn nhiều bản cập nhật mà OpenAI chưa tiết lộ, bao gồm model GPT-5 thế hệ tiếp theo, có thể sẽ cung cấp năng lượng cho phiên bản trả phí khi ra mắt. Chúng ta cũng chưa có cập nhật về việc phát hành model video AI Sora hoặc Voice Engine.

Tuy nhiên, có quá đủ thứ để khiến khán giả đam mê AI hào hứng trong sự kiện trực tiếp, bao gồm GPT-4o đa phương thức hoàn chỉnh, có thể tiếp nhận và hiểu nội dung giọng nói, hình ảnh và video, phản hồi bằng giọng nói hoặc văn bản.

Dưới đây là một số khoảnh khắc then chốt:

  • Người dùng ChatGPT miễn phí lần đầu tiên được quyền truy cập vào chatbot tùy chỉnh
  • Model GPT-4o mới, hiệu quả hơn sẽ cung cấp năng lượng cho các phiên bản miễn phí và trả phí
  • GPT-4o được thiết kế theo mô hình đa phương thức (multimodal), có khả năng phân tích hình ảnh, video và giọng nói
  • Model đa phương thức sẽ cung cấp năng lượng cho ChatGPT Voice mới, giống con người hơn Ứng dụng
  • ChatGPT Desktop ra mắt với các khả năng về giọng nói và thị giác
  • Mọi thứ dần dần ra mắt trong những tuần tới
https://youtu.be/DQacCB9tDaw
Introducing GPT-4o
https://youtu.be/c2DFg53Zhvw
GPT-4o as a live translation device

0 Lời bình

Bạn cũng có thể đọc thêm:

Context Engineering: Kỹ năng số 1 năm 2025 trong lĩnh vực AI

Mọi điều bạn cần biết về Context Engineering để triển khai các ứng dụng AI thành công Hãy làm rõ một điều: nếu bạn vẫn chỉ nói về "prompt engineering," bạn đã đi sau thời đại. Trong những ngày đầu của các Mô hình ngôn ngữ lớn (LLM), việc tạo ra một prompt hoàn hảo là...

Tái định hình mô hình Spotify cho human-AI enterprise

Các doanh nghiệp phải tiến hóa: Kiến trúc Spotify 2.0 tái định hình các đội agile với các tác tử AI để thúc đẩy quy mô, tốc độ và sự thực thi thông minh hơn, linh hoạt hơn. Tại sao phải phát minh lại mô hình Spotify?1. Composite squad: Các đội ngũ kết hợp Người-AI2....

Các Startup AI Agent Đang Trở Thành Cỗ Máy Doanh Thu — Xếp Hạng Top 20

Các công ty AI agent đã và đang thành công thương mại hóa từ hàng tỷ đô la huy động được. Chúng tôi đã sử dụng dữ liệu doanh thu của CB Insights để xếp hạng top các startup tư nhân hàng đầu cung cấp AI agent. Dựa trên dữ liệu Commercial Maturity của CB Insights, 42%...

Liên hệ