Apple đã thông báo rằng họ đã phát triển một mô hình hệ thống trí tuệ nhân tạo (AI) có khả năng hiểu và tạo ra nhiều loại dữ liệu khác nhau đồng thời, như văn bản và hình ảnh. Hệ thống AI này được đặt tên là MM1.
Nếu như MGIE (MLLM-Guided Image Editing) là giải pháp kết hợp giữa mô hình ngôn ngữ với khả năng tạo hình của AI để chỉnh sửa hình ảnh theo những câu lệnh của người dung. Thì MM1 là giải pháp mô hình ngôn ngữ lớn đa chế độ (MLLM - Multimodal Large Language Model) với khả năng nhận diện và mô tả lại cho người dùng nhiều dạng dữ liệu đầu vào, từ văn bản cho tới hình ảnh.
Theo Apple, MM1 được huấn luyện từ thư viện dữ liệu bao gồm hình ảnh kèm chú thích, văn bản có cả chữ và hình minh họa, cùng dữ liệu văn bản thuần túy. Apple cho biết: “Sau sự phát triển của LLM, MLLM sẽ là đích đến tiếp theo của những mô hình AI nguồn, dùng làm tiền đề cho những giải pháp ứng dụng.”
Về mặt tính năng, Apple cho biết MM1 có khả năng nhận diện nhiều chi tiết trong hình ảnh hay văn bản. Xét riêng về khả năng thì nó có thể nhận diện hình ảnh, có thể đếm số vật thể trong hình, nhận diện một phần tấm hình xem là nội dung gì, ứng dụng mô hình ngôn ngữ để mô tả những sự vật hiện tượng trong tấm hình, hay thậm chí làm mấy phép toán cộng trừ nhân chia đơn giản.
Bên cạnh khả năng nhận diện và tóm tắt nội dung hình ảnh và văn bản, MM1 hỗ trợ học nội dung dựa theo ngữ cảnh, tức là sẽ không cần huấn luyện lại hoặc tinh chỉnh mô hình, mà nó sẽ đủ khả năng hiểu nội dung nhờ vào việc người dùng cung cấp ngữ cảnh.
Vào tháng 2/2024, Giám đốc điều hành Apple, ông Tim Cook đã tiết lộ trong một cuộc họp với các nhà đầu tư rằng ông nhận thấy: “Tiềm năng đột phá đáng kinh ngạc của AI có khả năng sáng tạo, đó là lý do tại sao chúng tôi hiện đang đầu tư đáng kể vào lĩnh vực này”.
Kỹ sư cấp cao Brandon McKinzie của Apple viết trên X như sau: MM1 mới chỉ là bước khởi đầu, và Apple hiện tại đã tiếp tục nghiên cứu thế hệ mô hình ngôn ngữ quy mô lớn đa chế độ tiếp theo. Với những gì thể hiện, một phần những gì MM1 có thể làm được khá giống với tính năng Circle to Search đã ra mắt trên vài chiếc điện thoại Android đời mới nhất hiện giờ.
Apple công bố MM1 trùng với thời điểm có những tin đồn nói rằng họ đang mong muốn có những giải pháp AI trên iOS 18 dành cho iPhone 15 hay iPhone 16 mới nói chung.
Thông tin trước đó là, Apple đang phát triển iOS 18 như một bản nâng cấp rất lớn của hệ điều hành iPhone, dựa trên những mô hình AI họ tự phát triển. Nhưng những tính năng mới và cải tiến này sẽ chỉ tập trung ở khía cạnh giải pháp xử lý local, thay vì xử lý trên máy chủ đám mây. Vậy nên Apple cần tới một đối tác sở hữu LLM đủ sức mạnh phục vụ cho người dùng, thông qua những giải pháp tạo nội dung xử lý tại data center và gửi kết quả về thiết bị đầu cuối, chẳng hạn như tạo hình bằng AI, hay viết những văn bản dài dựa trên lệnh của người dùng.
Viết bình luận
Bình luận