Meta цього тижня випустила Brain2Qwerty v2 — неінвазивну систему інтерфейсу мозок-комп’ютер, яка за допомогою шоломного сканера MEG (магнітоенцефалографія) записує нейронну активність і безпосередньо декодує цільовий текст через наскрізну модель глибокого навчання. Середня точність за словами сягає 61%. Meta також оприлюднила вихідний код і набір даних як частину свого Digital Brain Project, а також заснувала фонд у 5 мільйонів доларів.
Система використовує наскрізну (end-to-end) модель глибокого навчання, яка декодує вихідний текст безпосередньо з сирих сигналів MEG, не покладаючись на ручні проміжні етапи обробки; велика мовна модель на пізньому етапі виправляє помилки, спричинені шумом, на основі семантичного контексту.
Масштаб навчальних даних: близько 22 000 речень від 9 волонтерів, приблизно 10 годин запису на кожного. Meta зазначає, що точність постійно зростатиме зі збільшенням обсягу навчальних даних. Для порівняння: версія v1 в умовах MEG мала рівень помилок символів (CER) близько 32%; та сама задача з використанням EEG (електроенцефалографія) зростала до приблизно 67%.
MEG використовує надпровідні датчики для виявлення надзвичайно слабких магнітних полів, що виникають під час активності нейронів. Магнітне поле має кращу проникність, ніж EEG, тому сигнал відносно чіткий. Однак шолом MEG коштує мільйони доларів і потребує спеціального середовища, ізольованого від зовнішніх магнітних полів, тому тривалий час залишався лише в лабораторіях нейронауки, не використовуючись у клінічній чи споживчій практиці.
Brain2Qwerty v2 досяг 61% точності за наявних обмежень обладнання, наблизившись до рівня, який раніше був доступний лише імплантованим інтерфейсам (наприклад, Neuralink). Вибір Meta на користь неінвазивного підходу виходив з того, що хірургічний поріг імплантованих інтерфейсів робить їх неприйнятними для більшості потенційних користувачів.
Під час випуску Brain2Qwerty v2 Meta також оприлюднила вихідний код системи та навчальний набір даних як частину Digital Brain Project. Крім того, Meta заснувала фонд у 5 мільйонів доларів, спеціально призначений для підтримки створення відкритих наборів даних нейронауки.
Meta зазначає, що одним із вузьких місць досліджень неінвазивних BCI є нестача відкритих великомасштабних наборів нейроданих. Зараз різні дослідницькі установи повторно збирають базові дані з дуже низькою ефективністю; цей фонд має на меті сприяти спільному створенню еталонних даних спільнотою.
Імплантовані інтерфейси (наприклад, Neuralink) безпосередньо вживлюють електроди в кору мозку — сигнал чистий, низька затримка, висока точність, але потребує хірургічного втручання. Основним викликом неінвазивних методів є співвідношення сигнал/шум: череп і шкіра голови сильно послаблюють сигнал, особливо у EEG; MEG має відносно кращу проникність, але вартість обладнання та вимоги до середовища обмежують поширення.
Наскрізна модель декодує безпосередньо з сирих сигналів MEG у вихідний текст, без необхідності ручного проектування проміжних кроків дослідниками (наприклад, спочатку визначити конкретні події мозкової активності, а потім поступово виводити літери). Meta також у процесі розробки використовувала AI-агенти для систематичного дослідження простору оптимізації декодування, з якого інженери обрали остаточну конфігурацію навчання.
Brain2Qwerty v2 наразі тестується в лабораторних умовах на обладнанні MEG, є системою на етапі дослідження, ще не проходив клінічних випробувань або комерціалізації. Meta зазначає, що точність ще можна покращити, але терміни клінічного або комерційного впровадження на момент звіту не були оголошені.
Пов’язані новини
OpenAI оголошує про запуск макроклавіатури Codex, випуск 15 липня.
Micron Q3 дохід зріс на 346%, дефіцит пам'яті триває до 2028 року
Codex: вразливість квоти знову спричинила крах, OpenAI здійснює друге жорстке скидання.
Дослідники Microsoft опублікували статтю: якщо ChatGPT має свідомість, то й козел з Age of Empires 2 теж має.