Kỹ sư OpenAI Clive Chan Thách thức Khuyến nghị Phần cứng của V4, Trích dẫn Lỗi và Tính Mơ hồ so với V3

Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là “đáng ngạc nhiên là tầm thường và dễ gây lỗi” so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A đã trở thành chủ đề thảo luận phổ biến nhất tại hội nghị học thuật ISCA, đưa ra các khuyến nghị cụ thể phù hợp với các tiêu chuẩn kết nối liên ngành trong ngành. Ngược lại, V4 lại còn mơ hồ hơn rất nhiều.

Chan đã phản biện có hệ thống ba khuyến nghị then chốt. Về mức tiêu thụ điện năng, báo cáo cho rằng việc tối ưu hóa phần mềm cho phép chip chạy đồng thời ở mức công suất tối đa cho tính toán, lưu trữ và truyền thông, đồng thời khuyến nghị các nhà sản xuất chip dành ra thêm phần dự trữ công suất. Chan lập luận rằng điều này phản tác dụng: tổng công suất của chip bị giới hạn bởi các hạn chế của quy trình vật lý, do đó việc dành thêm biên công suất chỉ làm giảm tần số hoạt động, cuối cùng kéo giảm hiệu suất tính toán. Đối với truyền dữ liệu GPU-GPU, báo cáo đề xuất mô hình kéo—trong đó các GPU chủ động nạp dữ liệu—thay vì mô hình đẩy, viện dẫn chi phí thông báo cao trong các thao tác đẩy. Chan phản bác điều này, cho rằng mô hình kéo thực ra còn chậm hơn và năng lực bộ điều hợp mạng được cải thiện sẽ là lựa chọn tốt hơn. Tuy nhiên, hai bên có thể đang thảo luận về những lớp khác nhau của vấn đề: báo cáo đề cập đến chi phí do cơ chế thông báo, còn Chan lại nói về độ trễ truyền tải.

Về các hàm kích hoạt, báo cáo khuyến nghị thay thế SwiGLU bằng các hàm đơn giản hơn để giảm gánh nặng tính toán. Chan không thấy có giá trị trong việc này, lưu ý rằng Sonic MoE đã chứng minh hiệu suất tối ưu khi sử dụng SwiGLU. Chan nghi ngờ DeepSeek có thể đã “cố ý làm suy yếu phần này.”

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

OpenAI DevDay 2026 sẽ được tổ chức vào 29/9 tại San Francisco

Thông báo chính thức của OpenAI ngày 29/4 cho biết hội nghị nhà phát triển hàng đầu DevDay 2026 sẽ diễn ra vào ngày 29/9 tại San Francisco, quay trở lại hình thức hội nghị trực tiếp sau nhiều năm vắng bóng. Cùng với đó là một hoạt động nhận bài dự thi: nhà phát triển dùng GPT-5.5 và Image Gen để tạo tác phẩm và nộp bài; mỗi tuần, Codex sẽ sàng lọc 2-3 bài nộp mang tính sáng tạo, người đạt sẽ nhận vé miễn phí tham dự DevDay (bao gồm chi phí vé máy bay liên thành phố và khách sạn). Chủ đề đại hội: hệ sinh thái dành cho nhà phát triển xoay quanh GPT-5.5 + Image Gen Ngăn xếp ứng dụng cốt lõi của DevDay lần này rõ ràng tập trung vào GPT-5.5. GPT-5.5 ra mắt vào ngày 23/4, mở API toàn diện vào ngày 24/4; cùng với GPT-5.4 vào cuối tháng 4

ChainNewsAbmedia12phút trước

BioMysteryBench: Mythos giải chuyên gia không có lời giải 29,6%

Anthropic ngày 29 tháng 4 đã công bố chính thức BioMysteryBench—một bộ tiêu chí đánh giá mới cho năng lực phân tích sinh tin học của AI, bao gồm các câu hỏi mở dựa trên bối cảnh nghiên cứu thực tế. Dữ liệu đáng chú ý nhất là: trong số những câu hỏi mà nhóm chuyên gia con người vẫn không thể giải được sau khi thử, mô hình chủ lực Mythos của Anthropic giải được 29,6%, còn Opus giải được 27,0%. Thiết kế đánh giá: song song hai mạch “có thể giải” và “chuyên gia không giải được” BioMysteryBench gồm hai dạng câu hỏi. Dạng thứ nhất là “có thể giải”—các nhiệm vụ phân tích do nhà nghiên cứu sinh tin học thiết kế, có đáp án chuẩn để đối chiếu; dạng thứ hai là “chuyên gia không giải được”—những câu hỏi mà nhóm chuyên gia con người sau khi thử vẫn không tìm được lời giải đáng tin cậy, nhằm kiểm tra liệu mô hình có thể vượt qua ranh giới kiến thức của lĩnh vực hiện tại hay không.

ChainNewsAbmedia15phút trước

OpenAI Công bố sắp ra mắt mô hình an ninh mạng GPT-5.5-Cyber trong vài ngày tới

Theo Cointelegraph, Sam Altman cho biết OpenAI sẽ ra mắt GPT-5.5-Cyber, một mô hình về an ninh mạng, trong vài ngày tới. Mô hình sẽ được cung cấp cho các nhà bảo vệ an ninh mạng quan trọng, và OpenAI dự định thiết lập các cơ chế truy cập được tin cậy với sự phối hợp của các cơ quan chính phủ để

GateNews44phút trước

Giám đốc điều hành Google DeepMind dự đoán AGI sẽ xuất hiện vào năm 2030, cho các công ty bốn năm để chuẩn bị

Theo loạt video của Sequoia Capital với sự góp mặt của Demis Hassabis, CEO của Google DeepMind dự đoán trí tuệ nhân tạo tổng quát (AGI) sẽ xuất hiện vào năm 2030. Hassabis, người đoạt Giải Nobel Hóa học năm 2024, coi mốc thời gian này là một thực tế kinh doanh nghiêm ngặt, buộc các nhà lãnh đạo phải suy nghĩ lại cách phát triển sản phẩm de

GateNews48phút trước

OpenAI vận hành như một công ty lợi nhuận thấp kéo dài, ký hợp đồng mua điện trong 20 năm

Theo Odaily, CEO của OpenAI Sam Altman cho biết tại Stripe Sessions rằng OpenAI đặt mục tiêu trở thành một công ty hạ tầng có lợi nhuận thấp một cách bền vững nhưng quy mô lớn và tăng trưởng nhanh, cung cấp các sản phẩm tương tự như một “công tơ thông minh” mà người dùng có thể mua để tự động hóa hoạt động kinh doanh hoặc nhúng vào

GateNews49phút trước

Forefront Tech hoàn tất định giá IPO $100M , sẽ niêm yết trên Nasdaq

Theo ChainCatcher, Forefront Tech Holdings Acquisition Corp đã hoàn tất định giá IPO 100 triệu USD vào ngày 30/4, dự kiến niêm yết trên Nasdaq với mã FTHAU. Số tiền thu được sẽ được sử dụng để tìm kiếm cơ hội sáp nhập và mua lại trong blockchain, trí tuệ nhân tạo, fintech và các lĩnh vực khác

GateNews1giờ trước
Bình luận
0/400
Không có bình luận