OpenAI chính thức phát hành Sora, công cụ chuyển văn bản thành video
Ngày 10/12, OpenAI đã chính thức ra mắt Sora, một mô hình trí tuệ nhân tạo (AI) tiên tiến cho phép tạo video từ văn bản, dành riêng cho người dùng ChatGPT Plus và Pro.
Công cụ này đánh dấu bước tiến quan trọng trong việc mở rộng các công nghệ AI đa phương thức của OpenAI, cạnh tranh trực tiếp với các sản phẩm tương tự từ Meta, Google và Stability AI.
Sora hỗ trợ tạo video với độ phân giải lên đến 1080p, thời lượng tối đa 20 giây, và có thể chọn các định dạng màn hình như ngang, dọc, hoặc vuông. Người dùng có thể nhập các đoạn văn bản chi tiết để tạo video hoặc tải lên hình ảnh và video cá nhân để chỉnh sửa. Đặc biệt, tính năng "Remix" cho phép thay đổi nội dung một video hiện có, trong khi "Storyboard" giúp ghép các đoạn văn bản thành một video liền mạch.
Sora được thiết kế với các biện pháp an toàn nhằm ngăn chặn lạm dụng, như cấm tạo nội dung bạo lực, vi phạm bản quyền, hoặc liên quan đến khai thác trẻ em và deepfake. Hiện tại, công cụ này chưa khả dụng tại EU, Thụy Sĩ và Anh do các quy định pháp lý, nhưng đã được phát hành ở nhiều khu vực khác.
Mặc dù Sora cho phép tạo ra các cảnh quay sáng tạo, công nghệ này vẫn còn một số hạn chế, như mô phỏng chuyển động vật lý chưa chính xác, dễ nhầm lẫn trong xử lý các cảnh phức tạp, hoặc tạo ra các đối tượng không mong muốn trong video.
OpenAI dự kiến cung cấp các gói giá phù hợp cho nhiều nhóm người dùng vào đầu năm 2025. Đồng thời, hãng cũng tích cực hợp tác với các chuyên gia để đảm bảo an toàn trong quá trình sử dụng công nghệ mới này.
Hồng Hạnh (theo Reuters, CNA)