Meta tuần này phát hành Brain2Qwerty v2, một hệ thống giao diện não-máy tính không xâm lấn ghi lại hoạt động thần kinh qua máy quét MEG (từ não đồ) dạng mũ bảo hiểm, sử dụng mô hình học sâu đầu cuối để giải mã trực tiếp văn bản mục tiêu, với độ chính xác trung bình từ đạt 61%. Meta đồng thời mã nguồn mở dữ liệu và mã nguồn như một phần của Dự án Não Kỹ thuật số, đồng thời thành lập quỹ 5 triệu USD.
Kiến trúc kỹ thuật của Brain2Qwerty v2: Quy mô huấn luyện và phương pháp giải mã đầu cuối
Hệ thống này sử dụng mô hình học sâu đầu cuối (end-to-end), giải mã trực tiếp từ tín hiệu MEG thô thành văn bản đầu ra, không phụ thuộc vào các bước xử lý trung gian thủ công; mô hình ngôn ngữ lớn ở giai đoạn sau hiệu chỉnh lỗi do nhiễu dựa trên ngữ cảnh ngữ nghĩa.
Quy mô dữ liệu huấn luyện: khoảng 22.000 câu, 9 tình nguyện viên, mỗi người khoảng 10 giờ dữ liệu ghi. Meta cho biết độ chính xác sẽ tiếp tục tăng khi lượng dữ liệu huấn luyện tăng lên. Để đối chiếu kỹ thuật, phiên bản v1 có tỷ lệ lỗi ký tự (CER) khoảng 32% trong điều kiện MEG; khi thay bằng EEG, con số này tăng lên khoảng 67%.
Lợi thế kỹ thuật của MEG và hạn chế thiết bị hiện tại
MEG sử dụng cảm biến siêu dẫn để phát hiện từ trường cực nhỏ do hoạt động thần kinh tạo ra, khả năng xuyên thấu từ trường tốt hơn EEG, tín hiệu tương đối rõ ràng; nhưng mũ MEG có giá hàng trăm nghìn USD và yêu cầu môi trường cách ly từ trường đặc biệt, từ lâu chỉ giới hạn trong phòng thí nghiệm khoa học thần kinh, chưa đi vào ứng dụng lâm sàng hoặc tiêu dùng.
Brain2Qwerty v2 đạt độ chính xác 61% trong điều kiện hạn chế thiết bị này, tiếp cận mức độ trước đây chỉ có giao diện cấy ghép (như Neuralink) mới đạt được. Điểm xuất phát của Meta khi chọn hướng không xâm lấn là: rào cản phẫu thuật của giao diện cấy ghép khiến đa số người có tiềm năng hưởng lợi khó chấp nhận.
Kế hoạch mã nguồn mở của Meta: Dự án Não Kỹ thuật số và quỹ 5 triệu USD
Khi phát hành Brain2Qwerty v2, Meta đồng thời công khai mã nguồn hệ thống và bộ dữ liệu huấn luyện như một phần của Dự án Não Kỹ thuật số. Meta cũng thành lập quỹ 5 triệu USD, chuyên dùng để hỗ trợ xây dựng bộ dữ liệu thần kinh mở.
Meta chỉ ra rằng một trong những nút thắt của nghiên cứu BCI không xâm lấn là thiếu bộ dữ liệu thần kinh quy mô lớn công khai; hiện nay các tổ chức nghiên cứu thu thập dữ liệu cơ bản lặp đi lặp lại với hiệu suất rất thấp; quỹ này nhằm thúc đẩy cộng đồng cùng xây dựng dữ liệu chuẩn.
Câu hỏi thường gặp
Khoảng cách kỹ thuật cốt lõi giữa giao diện não-máy tính không xâm lấn và cấy ghép là gì?
Giao diện cấy ghép (như Neuralink) cấy điện cực trực tiếp vào vỏ não, tín hiệu sạch, độ trễ thấp, độ chính xác cao, nhưng cần phẫu thuật. Thách thức chính của phương pháp không xâm lấn là tỷ lệ tín hiệu/nhiễu: hộp sọ và da đầu làm suy giảm tín hiệu nghiêm trọng, đặc biệt là EEG; MEG có khả năng xuyên thấu tương đối tốt hơn, nhưng chi phí thiết bị và yêu cầu môi trường hạn chế khả năng phổ biến.
Ý nghĩa kỹ thuật của mô hình "đầu cuối" của Brain2Qwerty v2 là gì?
Mô hình đầu cuối giải mã trực tiếp từ tín hiệu MEG thô thành văn bản đầu ra, không cần nhà nghiên cứu thiết kế thủ công các bước trung gian (ví dụ: trước hết nhận diện các sự kiện não cụ thể rồi suy luận từng chữ cái). Trong quá trình phát triển, Meta đã sử dụng các tác nhân AI để khám phá một cách có hệ thống không gian tối ưu hóa của quy trình giải mã, từ đó các kỹ sư chọn ra cấu hình huấn luyện cuối cùng.
Khi nào hệ thống này có thể đi vào lâm sàng hoặc thị trường thương mại?
Brain2Qwerty v2 hiện đang được thử nghiệm trên thiết bị MEG trong phòng thí nghiệm, thuộc giai đoạn nghiên cứu, chưa đi vào thử nghiệm lâm sàng hoặc thương mại hóa. Meta cho biết độ chính xác vẫn còn dư địa cải thiện, nhưng thời gian lâm sàng hoặc thương mại hóa tính đến thời điểm báo cáo chưa được công bố.