今天跑了一整天 Codex automation。


最大的感受:
agent 最有價值的地方,
不是自動幫你做完所有事。
而是持續把一堆卡住的在途任務,
推進到下一個明確的 checkpoint。
今天它做了幾類事:
1. 能寫代碼的,直接進 clean worktree 修。
比如一個 wiki compiler 的誤判 bug,
先在乾淨 worktree 修完,
驗證通過後,
再經我批准 cherry-pick 回主倉。
2. 能驗證的,直接刷新證據。
比如策略 preflight、watch artifacts、dashboard,
它會把舊 blocker 重新校驗一遍,
然後寫回當前 gate。
3. 需要我拍板的,生成 decision card。
比如是否提交 KYC,
是否公開追問 affiliate 問題,
是否清一個 dirty repo 窗口。
這點很關鍵。
一個好的 agent workflow,
核心不是“全自動執行”。
核心是:
低風險的它持續推進;
高風險的它停下來,
把決策壓縮成一句我能批准或拒絕的話。
今天也踩了幾個坑:
dirty worktree 會卡集成;
長日誌會吃爆 context;
重複刷新舊 blocker 很浪費 token;
runner 退出不乾淨會留下 stale lock。
所以我最後把它改成兩層:
常駐層:
每 15 分鐘輕量掃一遍,
只看新 artifact、lock、decision queue、task timestamp。
深推層:
只有出現真實 trigger,
才選一個任務推進到 commit、report、parser、decision card 或 waiting sample。
這套東西跑下來,
更像一個 junior PM + engineer。
它不替我做產品判斷,
但會持續清 backlog,
把模糊問題推成明確證據,
把隱性卡點推成顯性決策。
我現在越來越覺得:
未來個人工作流的核心能力,
不是“會不會用 AI 寫代碼”。
而是你能不能把自己的任務系統,
設計成 agent 可以持續推進的形狀。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆