12/06/2025 lúc 11:06

Apple phá vỡ ảo tưởng về suy luận AI siêu trí tuệ

Apple: AI suy luận tiên tiến chỉ bắt chước dữ liệu, chưa “suy nghĩ” như con người, đặt nghi vấn về AGI, làm lung lay niềm tin vào khả năng AI hiện tại.

AI suy luận chỉ là bắt chước?

Minh họa AI có thể "suy luận". Ảnh: Meta AI
Minh họa AI có thể “suy luận”. Ảnh: Meta AI

Apple vừa công bố nghiên cứu mang tên “Ảo Tưởng Về Tư Duy”, thách thức quan niệm rằng các mô hình suy luận lớn (LRM) như OpenAI o1, Claude 3.7 Sonnet Thinking hay DeepSeek R1 có khả năng “suy luận” như con người. Thay vào đó, nghiên cứu chỉ ra rằng các mô hình này chủ yếu dựa vào việc nhận diện và lặp lại các mẫu dữ liệu đã học, chứ không thực sự thực hiện các bước tư duy logic.

Để kiểm chứng, Apple thiết kế một môi trường giải đố với các trò chơi logic như Tháp Hà Nội, Nhảy Quân, Vượt Sông và Thế Giới Khối Hộp. Các thử thách được điều chỉnh độ khó từ dễ đến phức tạp, giúp nhóm nghiên cứu quan sát cách AI xử lý vấn đề. Kết quả cho thấy, dù hoạt động tốt ở các bài toán đơn giản hoặc trung bình, các LRM sụp đổ hoàn toàn khi đối mặt với thách thức phức tạp, với độ chính xác giảm xuống mức zero.

Ví dụ, Claude 3.7 Sonnet Thinking có thể xử lý hơn 100 bước trong Tháp Hà Nội, nhưng lại thất bại chỉ sau 4 bước trong bài toán Vượt Sông đơn giản hơn. Điều này cho thấy sự thiếu nhất quán và hạn chế trong khả năng suy luận của các mô hình AI hiện tại, ngay cả khi được cung cấp thêm tài nguyên tính toán.

Hạn chế của mô hình suy luận

Hạn chế của mô hình suy luận. Ảnh: Sưu tầm
Hạn chế của mô hình suy luận. Ảnh: Sưu tầm

Nghiên cứu của Apple phát hiện một xu hướng đáng lo ngại: khi độ phức tạp tăng, các LRM không tăng cường nỗ lực suy luận mà ngược lại, giảm sử dụng tài nguyên tính toán, hay “suy nghĩ” ít hơn. Điều này đi ngược với kỳ vọng rằng các mô hình tiên tiến sẽ xử lý tốt hơn khi được cung cấp thêm sức mạnh tính toán.

Các nhà khoa học tại Apple kết luận rằng các chuỗi suy luận dài dòng của LRM trông có vẻ thông minh, nhưng thực chất không phản ánh quá trình tư duy logic mà chỉ là sự suy đoán dựa trên dữ liệu huấn luyện. “Chúng ta có thể đang ảo tưởng về khả năng hiện tại của các mô hình suy luận,” báo revived, nhấn mạnh khoảng cách xa vời đến AGI – hệ thống AI có khả năng tư duy như con người.

Phát hiện này không hoàn toàn mới. Gary Marcus, chuyên gia AI và nhà tâm lý học tại Đại học New York, cho rằng nghiên cứu của Apple chỉ củng cố các quan điểm trước đó. Ông trích dẫn nghiên cứu từ năm 1998 của mình, nhấn mạnh rằng các mạng nơ-ron, tiền thân của LRM, chỉ hoạt động tốt trong phạm vi dữ liệu đã học, nhưng sụp đổ khi gặp tình huống ngoài dự đoán.

Phản hồi từ giới chuyên gia

Nghiên cứu của Apple đã gây tiếng vang trong cộng đồng công nghệ. Gary Marcus mô tả phát hiện này là “khá tàn khốc”, cho rằng các mô hình ngôn ngữ lớn (LLM) và LRM không phải con đường trực tiếp dẫn đến AGI. Ông cảnh báo rằng việc nhân hóa các chuỗi suy luận của AI là một sai lầm, khi chúng không thực sự “suy nghĩ” mà chỉ tái hiện các mẫu dữ liệu.

Andrew Rogoyski từ Đại học Surrey nhận định rằng ngành AI có thể đang đi vào “ngõ cụt” với cách tiếp cận hiện tại. “Các mô hình này chỉ xử lý tốt các vấn đề từ dễ đến trung bình, nhưng bất lực trước những thách thức phức tạp,” ông nói với Guardian. Điều này đặt ra câu hỏi về hướng đi tương lai của ngành công nghệ AI.

Tuy nhiên, Marcus cũng lưu ý rằng LRM vẫn có giá trị trong một số ứng dụng cụ thể, nhưng người dùng cần cẩn trọng và không nên đặt niềm tin mù quáng vào kết quả của chúng. Các mô hình này hữu ích như công cụ hỗ trợ, nhưng chưa thể thay thế trí tuệ con người.

Cơ hội và thách thức AI trong đời sống

Sự phát triển của AI, dù chưa đạt đến tầm AGI, vẫn đang thay đổi cách con người làm việc và sáng tạo. Trong lĩnh vực xuất bản, các tác giả được khuyến khích xem AI như một “siêu trợ lý” thay vì đối thủ. Nhiều nhà văn cho rằng việc tận dụng AI một cách thông minh có thể giúp họ duy trì lợi thế sáng tạo trong thời đại công nghệ.

Nghiên cứu của Apple là lời nhắc nhở rằng, dù AI có tiềm năng lớn, nó vẫn còn giới hạn. Các doanh nghiệp và nhà phát triển cần tập trung vào việc cải thiện khả năng suy luận thực sự, thay vì dựa vào các chuỗi dữ liệu lặp lại. Trong khi chờ đợi những bước tiến mới, con đường đến AGI vẫn còn là một chặng đường dài và đầy thử thách.

Thùy Linh