Anthropic Phát Hành Claude Opus 4.7 Với Năng Lực Cyber Mất Yếu Đi

CryptoFrontier

Anthropic đã phát hành một phiên bản nâng cấp của mô hình chủ lực của họ, Claude Opus 4.7, vào ngày 16 tháng 4 (theo giờ địa phương). So với mô hình Opus 4.6 trước đó, Opus 4.7 thể hiện “những cải thiện đáng kể” về năng lực kỹ thuật phần mềm nâng cao, đặc biệt trong các tác vụ khó, với độ chặt chẽ và tính nhất quán được nâng cao trong các tác vụ phức tạp chạy lâu và khả năng nhìn được cải thiện. Tuy nhiên, Anthropic đã cố ý làm suy yếu khả năng tấn công-phòng thủ an ninh mạng của mô hình trong quá trình huấn luyện và đưa vào các cơ chế an toàn để tự động phát hiện và chặn các yêu cầu bị cấm hoặc có rủi ro cao.

Hiệu suất và điểm chuẩn

Trong thử nghiệm điểm chuẩn, Opus 4.7 đạt các mức điểm nhìn chung cao hơn so với Opus 4.6 trước đó và mô hình cạnh tranh GPT-5.4. Tuy nhiên, Anthropic nhấn mạnh rằng năng lực tổng thể của Opus 4.7 không tương xứng với mô hình mạnh nhất của công ty, Claude Mythos Preview. Theo Anthropic: “Bằng cách triển khai và vận hành các cơ chế bảo vệ này trong thế giới thực, chúng tôi sẽ tích lũy kinh nghiệm để cuối cùng cho phép phát hành rộng rãi các mô hình cấp Mythos.”

Triển khai và giá cả

Opus 4.7 hiện đã hoạt động trên tất cả các sản phẩm Claude và các giao diện API, được tích hợp với các dịch vụ Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry. Giá vẫn giữ nguyên so với Opus 4.6: $5 cho mỗi một triệu token đầu vào và $25 cho mỗi một triệu token đầu ra.

Thay đổi tiêu thụ token

Hai thay đổi trong Opus 4.7 so với Opus 4.6 sẽ ảnh hưởng đến việc sử dụng token. Thứ nhất, Opus 4.7 sử dụng bộ mã hóa (tokenizer) được cập nhật, cải thiện cách mô hình xử lý văn bản. Tuy nhiên, điều này có nghĩa là các đầu vào giống hệt nhau có thể tiêu thụ nhiều token hơn—khoảng 1 đến 1,35 lần mức tiêu thụ của thế hệ trước.

Thứ hai, Opus 4.7 thực hiện nhiều suy luận hơn ở mức “mức độ suy nghĩ” cao hơn, đặc biệt trong các vòng tiếp theo của các kịch bản dạng tác nhân. Điều này giúp tăng độ tin cậy cho các bài toán phức tạp nhưng tạo ra thêm các token đầu ra.

Token consumption increase visualization Gia tăng tiêu thụ token của Opus 4.7. Nguồn: Anthropic

Phân tích thị trường và bối cảnh

Các nhà phân tích mô tả Opus 4.7 là một mô hình “mang tính chuyển tiếp”. Nhà phân tích đầu tư Adam Button cho biết việc phát hành Opus 4.7 củng cố câu chuyện của Anthropic xung quanh các mô hình “siêu phàm” như Mythos và xác nhận sự hoài nghi của thị trường: các mô hình trả phí hiện có công khai về cơ bản là các phiên bản “lite” bị ràng buộc bởi các cơ chế an toàn.

Nền tảng công ty và mốc tài chính

Anthropic, được thành lập năm 2021 bởi các cựu nhân viên OpenAI, phát triển dòng mô hình ngôn ngữ lớn Claude. Vào ngày 6 tháng 4, Anthropic công bố doanh thu hàng năm hóa của họ (ARR) vượt $300 billion, mức tăng đáng kể so với $9 billion vào cuối năm 2025. Công ty đang tích cực theo đuổi một đợt phát hành cổ phiếu lần đầu ra công chúng.

Lo ngại rủi ro an ninh mạng

Các lãnh đạo của Anthropic đã nhiều lần cảnh báo về tác động của AI đối với an ninh mạng. Theo các báo cáo đề ngày 10 tháng 4 (theo giờ địa phương), Bộ trưởng Tài chính Mỹ Yellen và Chủ tịch Cục Dự trữ Liên bang Powell đã tổ chức một cuộc họp khẩn với các lãnh đạo Phố Wall vào ngày 7 tháng 4 để thảo luận về việc mô hình AI Mythos mới nhất của Anthropic có thể làm gia tăng rủi ro an ninh mạng như thế nào. Anthropic đã tuyên bố Mythos không phù hợp để phát hành công khai vì mô hình có thể bị lạm dụng bởi tội phạm mạng và gián điệp. Công ty đang cung cấp quyền truy cập có chọn lọc vào Mythos cho các doanh nghiệp hàng đầu toàn cầu về an ninh mạng và phần mềm.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

AI tài chính liên kết với Trump mua Block Street với giá 43 triệu USD

Theo Fortune, AI Financial, một công ty tiền mã hoá có liên kết với gia đình Trump và trước đây từng có tên Alt5 Sigma, đã mua lại Block Street, một công ty hạ tầng crypto, với giá 43 triệu USD vào tuần trước. Matthew Morgan, cố vấn của AI Financial và đồng thời là CEO của Block Street, cho biết thương vụ mua lại này không phải là

GateNews10phút trước

Cổ phiếu Riot Tăng 8% Sau Khi Mở Rộng Thỏa Thuận Trung Tâm Dữ Liệu với AMD

Cổ phiếu của Riot Platforms đã tăng 8% sau khi mở rộng quan hệ đối tác trung tâm dữ liệu với AMD và các điều khoản tài trợ được cải thiện, phản ánh việc công ty khai thác bitcoin đang chuyển hướng chiến lược sang trí tuệ nhân tạo và trung tâm dữ liệu

GateNews2giờ trước

Minnesota cấm các công cụ AI tạo ảnh thân mật không có sự đồng ý, áp mức phạt lên tới $500K đô la Mỹ

Theo Decrypt, cơ quan lập pháp bang Minnesota đã thông qua một dự luật vào ngày 2 tháng 5, cấm các trang web và ứng dụng cung cấp công cụ AI tạo ra các hình ảnh thân mật không có sự đồng ý của cá nhân có thể nhận dạng. Luật này cấm các nền tảng cho phép người dùng truy cập hoặc sử dụng các công cụ “deepfake” như vậy, và cấm

GateNews4giờ trước

Người dùng ChatGPT giờ đây có thể truy cập các gói đăng ký trên nền tảng OpenClaw, Sam Altman công bố

Theo thông báo của Sam Altman hôm nay, người dùng ChatGPT hiện có thể đăng nhập vào nền tảng tác nhân OpenClaw bằng tài khoản ChatGPT của mình và truy cập trực tiếp các gói đăng ký ChatGPT hiện có trên nền tảng.

GateNews5giờ trước

xAI ra mắt Grok Custom Voices, cho phép người dùng sao chép giọng AI của chính mình trong 1 phút

Theo Beating, xAI đã ra mắt Grok Custom Voices và Voice Library, cho phép người dùng ghi lại 1 phút âm thanh trong bảng điều khiển xAI để tạo voice_id tùy chỉnh nhằm sử dụng với các API Grok TTS và Voice Agent. Tính năng này hỗ trợ các ứng dụng bao gồm tác nhân dịch vụ khách hàng, tạo nội dung,

GateNews6giờ trước

HBM 後, AI sẽ vướng “nút thắt” bộ nhớ mới là HBF? Người đoạt giải Turing David Patterson: Suy luận sẽ định nghĩa lại kiến trúc lưu trữ

Tác giả giải Turing David Patterson cho biết, khi AI chuyển từ giai đoạn huấn luyện sang suy luận quy mô lớn, nút thắt về bộ nhớ tiếp theo có thể không phải là HBM mà là HBF (bộ nhớ flash băng thông cao). HBF sử dụng kiến trúc xếp chồng NAND Flash để cung cấp dung lượng lớn, tiêu thụ điện năng thấp, đảm nhiệm việc truy cập bối cảnh và dữ liệu trung gian trong quá trình suy luận, khác với sự phân công giữa các loại bộ nhớ tối ưu cho tốc độ như HBM. SK Hynix và SanDisk đang thúc đẩy tiêu chuẩn hóa, dự kiến đến năm 2038 nhu cầu đối với HBF có thể vượt HBM.

ChainNewsAbmedia6giờ trước
Bình luận
0/400
GateUser-72e48736vip
· 04-20 02:41
Nếu tính chính xác cũng được tăng cường, thì việc xem xét mã/viết kiểm thử đơn/hoàn thiện tài liệu sẽ an toàn hơn, các kỹ sư phần mềm sẽ vui mừng khôn xiết.
Xem bản gốcTrả lời0
StargazingWithAMirroredSpherevip
· 04-17 09:22
Từ 4.6 đến 4.7 được gọi là "đáng kể", không rõ mức độ cải thiện lớn như thế nào trong việc gỡ lỗi chuỗi dài, tái cấu trúc và phạm vi kiểm thử?
Xem bản gốcTrả lời0
OrangePeelRadiovip
· 04-17 07:47
Xin một tiêu chuẩn: Liệu có thể tìm hết tất cả các lỗi ẩn trong PR phức tạp một lần không? Đừng chỉ viết các đoạn demo nhỏ.
Xem bản gốcTrả lời0
BlackVelvetBluePeonyvip
· 04-17 07:38
Anthropic này có vẻ đang tiến nhanh, Claude bây giờ ngày càng giống như một "kỹ sư cao cấp" chứ không chỉ là một chatbot.
Xem bản gốcTrả lời0
ReminderOfWavesCrashingAgainstvip
· 04-17 07:35
Nâng cao năng lực kỹ thuật phần mềm rất quan trọng, nhiệm vụ cấp độ kho mã nguồn mới là chiến trường thực sự.
Xem bản gốcTrả lời0
StargazingUnderTheGlassDomevip
· 04-17 07:32
4.7 Cuối cùng đã đến, mong đợi thử nghiệm thực tế.
Xem bản gốcTrả lời0
GateUser-5d719abavip
· 04-17 07:26
Hy vọng không lại là việc tăng điểm dựa trên bảng xếp hạng, trong các dự án thực tế, khi gặp xung đột phụ thuộc hoặc vấn đề môi trường thì sẽ gặp sự cố.
Xem bản gốcTrả lời0
TheWaveOfRasterizationvip
· 04-17 07:20
Tôi quan tâm hơn đến độ tin cậy của việc gọi công cụ và thay đổi nhiều tệp: liệu có thể duy trì tính nhất quán, không gây ra lỗi ở chỗ này rồi gây lỗi ở chỗ khác.
Xem bản gốcTrả lời0
StrollingOnTheEdgeOfTheDaovip
· 04-17 07:19
Chờ cộng đồng so sánh hiệu suất SWE của GPT/DeepSeek, đặc biệt là điều hướng kho lớn, định vị vấn đề, tốc độ giao hàng từ đầu đến cuối.
Xem bản gốcTrả lời0
BluePeonyObservervip
· 04-17 07:19
4.7 của “tăng cường tính nghiêm ngặt” nghe có vẻ cẩn trọng hơn, có thể sẽ ít bịa đặt API hơn? Điều này quá quan trọng.
Xem bản gốcTrả lời0
Xem thêm