Vừa mới thấy một điều thú vị về nghiên cứu mới nhất của Mem0—họ đang tạo ra những bước tiến lớn trong cách AI thực sự ghi nhớ mọi thứ qua các cuộc trò chuyện dài.



Vì vậy, đây là tình hình: Mem0 vừa công bố kết quả của họ trên chuẩn đánh giá LOCOMO, và các con số khá là ấn tượng. Thuật toán ghi nhớ lâu dài của họ đạt độ chính xác cao hơn 26% so với hệ thống ghi nhớ tích hợp của OpenAI. Đó không phải là một khoảng cách nhỏ. Nhưng điều thực sự thu hút sự chú ý của tôi là về mặt hiệu quả—họ giảm độ trễ suy luận P95 xuống 91% và giảm tiêu thụ token xuống 90%. Chúng ta đang nói về việc giải quyết vấn đề cổ điển của AI, nơi các hệ thống này... quên đi những thứ khi cuộc trò chuyện kéo dài.

Cách tiếp cận cũng rất thông minh. Thay vì chỉ đưa nhiều ngữ cảnh hơn vào vấn đề như phần lớn mọi người thường làm, Mem0 sử dụng hệ thống hai giai đoạn. Đầu tiên, họ trích xuất các sự thật thực sự từ các tin nhắn mới nhất, tóm tắt và lịch sử của bạn. Sau đó, họ so sánh điều đó với một cơ sở dữ liệu vector và cập nhật phù hợp—thêm dữ liệu mới, cập nhật xung đột, xóa dữ liệu không liên quan. Giữ mọi thứ sạch sẽ và nhất quán. Họ thậm chí còn xây dựng một phiên bản nâng cao gọi là Mem0ᵍ, sử dụng cấu trúc đồ thị để mô phỏng các mối quan hệ phức tạp giữa các thực thể qua nhiều phiên.

Điều thực sự quan trọng là gì? Tốc độ. Trong thực tế, Mem0 xử lý toàn bộ chu trình—lấy bộ nhớ, tạo phản hồi, mọi thứ—chỉ trong 0.71 giây. Các phương pháp truyền thống vẫn mắc kẹt gần 10 giây. Đó là sự khác biệt thực sự quan trọng cho các ứng dụng thực tế.

Nghiên cứu đã được chấp nhận bởi ECAI và họ đã mở mã nguồn trên GitHub, để mọi người có thể thực sự tìm hiểu cách hoạt động của nó. Đây cảm giác như một bước tiến nhỏ nhưng quan trọng trong việc làm cho các AI agent ít quên hơn. Đáng để theo dõi nếu bạn đang quan tâm đến lĩnh vực ghi nhớ và lý luận của phát triển AI.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim