Vào thứ 6, Meta Platforms đã phát hành một loạt các sản phẩm trí tuệ nhân tạo (AI) mới bao gồm “Trình đánh giá tự học” có khả năng kiểm tra độ chính xác của các mô hình AI khác. Do đó, mô hình này được cho là có thể cung cấp ít sự tham gia của con người hơn vào quá trình phát triển các mô hình AI.
Công ty mẹ của Facebook và Instagram cho biết họ đã phát hành các mô hình AI mới sau khi giới thiệu công cụ này trong một bài viết vào tháng 8, giải thích chi tiết cách công cụ này dựa trên cùng một kỹ thuật “chuỗi suy nghĩ” được các đối tác sử dụng. Nhà sản xuất ChatGPT OpenAI gần đây đã phát hành các mô hình 01.
Điều này dự kiến sẽ cho phép mô hình AI đưa ra các phán đoán đáng tin cậy về phản hồi của các mô hình.
Meta muốn giải quyết các thách thức về sự không chính xác
Theo các tin tức, mô hình này có thể kiểm tra và nâng cao độ chính xác của phản hồi đối với các vấn đề khó, chẳng hạn như các vấn đề trong môn học như khoa học, toán học và code, vì nó đòi hỏi phải chia nhỏ vấn đề phức tạp thành các bước logic nhỏ hơn.
Mục đích Meta hướng đến là giải quyết các thách thức gặp phải với các mô hình AI khác như ChatGPT, ngoài những lời chỉ trích về các câu trả lời lỗi thời và không chính xác.
Các nhà nghiên cứu tại Meta được cho là đã sử dụng toàn bộ dữ liệu do AI tạo ra để đào tạo mô hình đánh giá, loại bỏ đầu vào mang tính con người ở giai đoạn đó.
Hai nhà nghiên cứu của Meta nói rằng khả năng sử dụng AI để đánh giá AI khác một cách đáng tin cậy cung cấp cái nhìn thoáng qua về con đường khả thi hướng tới việc xây dựng AI tự chủ có thể học hỏi từ chính những sai lầm của mình.
“Chúng tôi hy vọng, khi AI ngày càng trở nên siêu phàm hơn, nó sẽ kiểm tra công việc của mình tốt hơn, để thực sự có thể tốt hơn người bình thường. Về cơ bản, ý tưởng tự học và có khả năng tự đánh giá là rất quan trọng đối với ý tưởng đạt đến cấp độ AI siêu phàm này”, nhà nghiên cứu Jason Weston lưu ý.
Meta đang hướng tới AI tự chủ
Theo các nhà nghiên cứu, các bên liên quan trong ngành AI coi những tác nhân này là trợ lý kỹ thuật số đủ thông minh để thực hiện nhiều nhiệm vụ khác nhau mà không cần sự can thiệp của con người.
Các nhà nghiên cứu khẳng định mô hình tự cải thiện có thể cắt giảm nhu cầu về một quy trình thường tốn kém và kém hiệu quả hiện đang được sử dụng có tên là Học tăng cường từ phản hồi của con người. Điều này đòi hỏi những người chú thích đầu vào phải có chuyên môn chuyên sâu để dán nhãn dữ liệu chính xác và xác minh câu trả lời cho các truy vấn toán học hoặc viết phức tạp là chính xác.
Các công ty trong ngành như Google và Anthropic cũng đã công bố các bài báo nghiên cứu về khái niệm RLAIF (Học tăng cường từ phản hồi của AI).
Tuy nhiên, không giống như Meta, những công ty khác này có xu hướng không công bố mô hình của họ để sử dụng công khai.
Các chuyên gia trong ngành AI cho rằng việc sử dụng AI để kiểm tra AI có ý nghĩa quan trọng trong việc xây dựng các ứng dụng AI tự chủ có thể hoạt động mà không cần sự can thiệp của con người. Điều đó có nghĩa là cuối cùng các mô hình AI sẽ học hỏi từ chính những sai lầm của chúng, tự sửa lỗi và cải thiện mà không cần bất kỳ sự tham gia nào từ chúng ta.
Gã khổng lồ truyền thông xã hội này cũng đã phát hành các công cụ khác bao gồm bản cập nhật cho Mô hình phân đoạn bất kỳ (SAM) nhận dạng hình ảnh, một công cụ giúp tăng tốc thời gian tạo phản hồi LLM và các tập dữ liệu có thể được sử dụng để hỗ trợ việc khám phá các vật liệu vô cơ mới.
Theo Coinviet tổng hợp
Cùng theo dõi Coinviet.net và xem thêm những tin tức hữu ích khác tại Dexnew.io nhé!