✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
斯坦福团队研究通过外化LLM假设来解释控制谄媚行为
ME News 消息,4 月 7 日(UTC+8),近日,一项由Myra Cheng、Isabel Sieh、Diyi Yang等多位研究者参与的研究,探讨了如何通过"外化"大语言模型的内部假设,来解释并控制模型在对话中表现出的"谄媚"行为。该研究旨在揭示模型产生此类行为的内在机制,并探索相应的干预方法。文中未提及具体的研究方法、实验数据或结论性发现。(来源:InFoQ)