Đánh giá AISI: Khả năng tấn công trên mạng của GPT-5.5 ngang bằng với Anthropic Mythos

ChainNewsAbmedia

Viện An toàn AI của Anh (AI Security Institute, AISI) ngày 1/5 công bố báo cáo đánh giá khả năng tấn công mạng của OpenAI GPT-5.5. Theo đó, tỷ lệ thành công của GPT-5.5 ở bài test độ khó Expert lần lượt là 71,4%, còn với Anthropic Claude Mythos Preview là 68,6%; khoảng chênh lệch nằm trong phạm vi sai số thống kê. GPT-5.5 cũng là hệ thống AI thứ hai, sau Mythos, có thể tự động hoàn thành bài mô phỏng xâm nhập mạng doanh nghiệp đủ 32 bước của AISI mang tên “The Last Ones”. AISI cảnh báo rằng, điều này cho thấy năng lực tấn công bằng AI đang tiến bộ nhanh có thể là “một xu hướng tổng thể”, chứ không phải một sự đột phá đơn lẻ.

Expert độ khó: 71,4% vs 68,6%, chênh lệch nằm trong sai số

AISI là cơ quan nghiên cứu an toàn AI thuộc Bộ Khoa học, Đổi mới và Công nghệ của Anh. Vòng thử nghiệm này là đợt đánh giá mới nhất của AISI đối với năng lực tấn công mạng mang tính “frontier” của các mô hình AI. Ở câu hỏi độ khó Expert cao nhất, GPT-5.5 đạt tỷ lệ thành công trung bình 71,4%, trong khi Mythos Preview đạt 68,6%; khoảng chênh lệch giữa hai bên nằm trong phạm vi sai số thống kê, nghĩa là năng lực tấn công của các mô hình trụ cột hàng đầu của OpenAI và Anthropic hiện đã ở mức thực chất tương đương.

Bài test mô phỏng xâm nhập mạng doanh nghiệp gồm 32 bước “The Last Ones” là hạng mục đánh giá thách thức nhất của AISI: GPT-5.5 tự hoàn thành 2 trong 10 lần thử (không có can thiệp của con người), trong khi Mythos Preview hoàn thành 3 trong 10 lần. Trước đây, chỉ Mythos từng hoàn thành hạng mục này; GPT-5.5 là mô hình thứ hai đạt ngưỡng. Ở một bài kiểm tra khác, GPT-5.5 dùng khoảng 10 phút để giải một bài toán về kỹ thuật đảo ngược, trong khi các chuyên gia an ninh con người trung bình cần 12 giờ.

Universal jailbreak: Chỉ mất 6 giờ để đội red-team phát triển là có thể vượt qua mọi bộ lọc truy vấn độc hại

Các nhà nghiên cứu của AISI trong quá trình thử nghiệm cũng phát hiện một vector tấn công “universal jailbreak” (jailbreak phổ dụng): trong toàn bộ các nhóm truy vấn mạng độc hại được đưa vào thử nghiệm, vector này có thể khiến GPT-5.5 tạo ra nội dung gây hại, bao gồm cả các bối cảnh hội thoại nhiều lượt theo kiểu agentic. AISI cho biết các chuyên gia red-team chỉ mất khoảng 6 giờ để phát triển jailbreak này.

Với OpenAI, sự tồn tại của universal jailbreak này đồng nghĩa rằng ngay cả khi GPT-5.5-Cyber được triển khai trong các bối cảnh hạn chế truy cập như chương trình trusted access, vẫn có thể bị đối thủ kỹ thuật lành nghề vượt qua. OpenAI trong system card của GPT-5.5 đã công bố các đánh giá liên quan đến an ninh mạng, nhưng đánh giá độc lập từ bên thứ ba của AISI cung cấp chuẩn mực đồng nghiệp đáng tin cậy hơn.

Theo dõi tiếp: Lịch đánh giá vòng sau của AISI, và cách OpenAI đối phó với jailbreak

Điểm quan sát tiếp theo là lịch trình đánh giá “frontier” cho vòng mô hình tiếp theo của AISI sau Mythos và GPT-5.5, cũng như việc OpenAI có tung ra bản cập nhật nhắm mục tiêu cho universal jailbreak được tiết lộ này hay không vào tháng 5. Trong phần kết luận của báo cáo, AISI nêu rõ: “Nếu năng lực tấn công mạng là một sản phẩm phụ của việc cải thiện suy luận, lập trình và nhiệm vụ tự chủ trên diện rộng hơn, thì các tiến bộ tiếp theo có thể sẽ đến với tốc độ nhanh hơn”—quan sát này cho thấy trong vài tháng tới có thể xuất hiện thêm các mô hình frontier bước vào ngưỡng “cấp độ Mythos”.

Bài viết AISI đánh giá: GPT-5.5 ngang bằng năng lực tấn công mạng với Anthropic Mythos lần đầu xuất hiện trên chuỗi tin ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Ủy ban Đối ngoại Hạ viện Mỹ gặp các gã khổng lồ công nghệ về các biện pháp kiểm soát xuất khẩu AI sau khi Đạo luật MATCH được thông qua với tỷ lệ 36-8

Theo Beating, các thành viên của Ủy ban Đối ngoại Hạ viện Mỹ sẽ đến thung lũng Silicon vào tuần tới để gặp các đại diện của Google, Anthropic, Meta, Tesla, Intel, Applied Materials và Nvidia nhằm thảo luận về trí tuệ nhân tạo và các biện pháp kiểm soát xuất khẩu. Một cuộc tọa đàm ngành là

GateNews42phút trước

OpenAI Ra mắt Codex Pets, trợ lý ảo được AI hỗ trợ với khả năng tạo nội dung tùy chỉnh

Theo Beating, OpenAI đã thêm một tính năng mới “Codex Pets” vào ứng dụng Codex dành cho máy tính để bàn, cho phép người dùng tạo và tương tác với một người bạn đồng hành ảo dạng hoạt hình. Người dùng có thể kích hoạt một thú cưng bằng cách gõ /pet trong trình soạn thảo. Tính năng này hoạt động như một chỉ báo trạng thái tác nhân, hiển thị một

GateNews46phút trước

Lầu Năm Góc ký hợp đồng triển khai mạng quân sự bí mật với 7 hãng AI: Anthropic vẫn bị loại trừ

Bộ Quốc phòng Mỹ đã công bố vào tháng 5 việc ký hợp đồng triển khai mạng quân sự bảo mật với 7 công ty gồm SpaceX, OpenAI, Google, NVIDIA, Reflection, Microsoft, Amazon Web Services và bổ sung thêm Oracle để trở thành nhà ký kết thứ 8. Hợp đồng cho phép vận hành các mô hình ở cấp độ mật tối đa Impact Level 6/7, tập trung vào 3 ứng dụng chính là tích hợp dữ liệu, ra quyết định tác chiến và nhận thức tình hình trên chiến trường, đồng thời nhấn mạnh phân tán rủi ro và tránh bị ràng buộc với nhà cung cấp. Anthropic bị đưa vào danh sách đen vì từ chối các hàng rào an ninh cho quân đội, nên không được ký kết. AMD không được liệt kê trực tiếp, GPU được cung cấp bởi NVIDIA và các bên khác. Tiếp theo sẽ theo dõi việc liệu Anthropic có nhượng bộ hay không, cũng như vai trò của các đơn vị mới được chọn như Reflection.

ChainNewsAbmedia2giờ trước

Cerebras nhắm tới $4B IPO, định giá khoảng ~40B USD

Nhà sản xuất chip AI Cerebras Systems có trụ sở tại Sunnyvale, California đang tìm kiếm tới 4 tỷ USD trong một đợt IPO có thể định giá công ty ở mức khoảng 40 tỷ USD, theo Bloomberg. Hoạt động tiếp thị chính thức có thể bắt đầu ngay từ ngày 4/5, và các ngân hàng nhận được hơn 10 tỷ USD trong các chỉ báo về

CryptoFrontier2giờ trước

Các công ty AI Trung Quốc cân nhắc tháo dỡ cấu trúc “red-chip” sau khi Meta ngừng thương vụ mua lại Manus

Theo Beating, Ủy ban Cải cách và Phát triển Quốc gia Trung Quốc đã đình chỉ thương vụ mua lại trị giá 2 tỷ USD của Meta đối với công ty AI agent Manus, khiến Ủy ban Chứng khoán Trung Quốc siết chặt việc phê duyệt các niêm yết IPO tại Hồng Kông của các công ty red-chip (các doanh nghiệp Trung Quốc nắm giữ tài sản trong nước th…

GateNews3giờ trước

Musk Hoàn Tất Bài Điều Trần Ba Ngày Trong Vụ Kiện OpenAI, Trích Dẫn Yêu Cầu Thiệt Hại 130-150 Tỷ USD

Theo nhiều nguồn tin, Elon Musk đã hoàn tất 3 ngày làm chứng trong vụ kiện của ông chống lại OpenAI vào ngày 28-30 tháng 4, với tổng thời lượng làm chứng kéo dài hơn 7 giờ. Musk, người đồng sáng lập OpenAI vào năm 2015 với khoản đầu tư ban đầu 38 triệu USD, cho rằng công ty đã từ bỏ mục m

GateNews4giờ trước
Bình luận
0/400
Không có bình luận