runesleo

vip
幣齡 8.4 年
最高等級 6
用戶暫無簡介
哇靠,我終於在 Codex App 裡跑通了“跨對話自動協作”。
一個對話,
可以定時喚醒另一個對話幹活。
它會自己讀交接文件、
執行任務、
寫回狀態。
跨對話這件事終於閉環了。
以前跨對話協作很麻煩。
你要手動打開另一個 thread,
複製上下文,
輸入 prompt,
等它跑完,
再把結果搬回主對話。
現在這件事變成了自動流程。
主對話推進任務時,
如果發現某一步該交給另一條業務線,
就寫一份交接文件。
裡面只放幾件事:
- 任務編號
- 當前卡在哪一關
- 目標對話要先讀哪些文件
- 要產出什麼結果
- 完成條件
- 紅線
然後主對話創建一個短期定時任務。
目標對話到點自動醒來,
讀取交接文件,
執行任務,
把結果寫回狀態文件。
主對話再醒一次,
檢查完成條件,
收結果,
繼續往下推進。
這套東西跑起來後,
Codex App 裡的對話就不只是聊天視窗了。
它更像一組可以被調度的工作單元:
一個負責總調度,
一個負責策略,
一個負責內容,
一個負責工程,
一個負責復盤。
後面還可以繼續加,
完全按自己的業務線定義。
它們通過文件交接,
通過定時任務喚醒,
通過狀態回寫形成閉環。
這可能是我目前最喜歡的 Codex App 用法,沒有之一。
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
大家沒有人用 Cursor,沒有重度 Cursor 用戶嗎?
這個 Composer 2.5 模型感覺很好用耶,好像有一開始用 Claude 的那種感覺。它沒有什麼讓你覺得做得不好的地方,一般都能比較好地交付你跟它說的這些任務。
在這個 Cursor 客戶端裡,比如多模型驗證啊什麼的都超級方便。我靠,我現在還是在用之前官方送的那 1 萬美元,還沒用完,然後附加一個 Ultra Plan,爽爽爽,再體驗一段時間。
查看原文
post-image
  • 打賞
  • 2
  • 轉發
  • 分享
GateUser-4ed95005:
就冲就完了 👊
查看更多
最近高強度使用 Cursor,做個階段小結。
【額度】
官方送的 $10K credits,目前已用 $8,387(83% 左右),6/1 左右到期。
Dashboard 上 40 萬+ AI line edits,5 月基本一直在跑。
一個意外發現:
credits 會自動抵扣 invoice,所以 Ultra 又續了一個月——這在我預期之外,但等於多拿一個月 included 额度,挺值。
【我現在的真實用法】
Claude 這輪沒續費之後,日常基本不怎麼用 Claude 了,Opus 也幾乎不點。
我現在主要在 Codex 5.5 和 Composer 2.5 之間選:
· Composer 2.5 — Cursor 裡跑長 loop、Agent 對話、批處理整理
· Codex 5.5 — 本機執行、repo 改動、MCP、收口寫回
偶爾會用 Grok 4.3,主要是情報檢索、外部信息消化這類任務。
工作流也在調整:Cursor 和 Codex 都當入口,不再只把 Cursor 當後台 daemon。
【踩過的坑】
之前不懂計費,在 Cursor 裡手動選 frontier 模型,一個月 API 池 $400–500 很快就沒了。
現在基本改燒 Composer 2.5 的 included 池,API 池幾乎用不到。
另一個坑是巨型 thread 的 context 成本
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
謝謝你,Elon,已經到帳了,今晚加雞腿🍗
查看原文
post-image
  • 打賞
  • 1
  • 轉發
  • 分享
稳健y我想沉着自信:
你是如何做到的
今天跑了一整天 Codex automation。
最大的感受:
agent 最有價值的地方,
不是自動幫你做完所有事。
而是持續把一堆卡住的在途任務,
推進到下一個明確的 checkpoint。
今天它做了幾類事:
1. 能寫代碼的,直接進 clean worktree 修。
比如一個 wiki compiler 的誤判 bug,
先在乾淨 worktree 修完,
驗證通過後,
再經我批准 cherry-pick 回主倉。
2. 能驗證的,直接刷新證據。
比如策略 preflight、watch artifacts、dashboard,
它會把舊 blocker 重新校驗一遍,
然後寫回當前 gate。
3. 需要我拍板的,生成 decision card。
比如是否提交 KYC,
是否公開追問 affiliate 問題,
是否清一個 dirty repo 窗口。
這點很關鍵。
一個好的 agent workflow,
核心不是“全自動執行”。
核心是:
低風險的它持續推進;
高風險的它停下來,
把決策壓縮成一句我能批准或拒絕的話。
今天也踩了幾個坑:
dirty worktree 會卡集成;
長日誌會吃爆 context;
重複刷新舊 blocker 很浪費 token;
runner 退出不乾淨會留下 stale lock。
所以我最後把它改成兩層:
常駐層:
每 15 分
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
今天踩了一個很小但很重要的坑:
不要讓 agent 操作你看不見的狀態。
我在做 X Pro 草稿排期時,本地 JSON 一度顯示不準。
最後發現真正能信的,不是 cache,
而是 X Pro 頁面上肉眼可見的狀態。
這件事讓我重新確認一個原則:
agent 可以幫你做重複操作,
但所有關鍵動作都要有可見狀態、可回滾路徑、可人工接管。
不然自動化越多,黑箱越大。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
X 後台新出了 active followers,
過去 24 小時活躍的粉絲數。
剛看了自己的:
14,031 / 21,300,
大概 66%。
第一反應覺得還不錯,
但沒有基準線,
真的不知道算高還是算低。
有一點是實在的:
以前看著 2 萬粉,
心裡沒數。
不知道裡面多少人昨天還在用 X,
現在有個數字落了地。
followers 是總量。
active followers 是昨天還在的那部分。
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
3. 38637 個市場地圖
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
我研究完 X 新推薦算法後,最大的結論不是“多發 AI”。
而是:帳號要有穩定的作者身份。
同一個作者只要被用戶連續消費 1-2 次,推薦系統就會強烈記住這個作者。
所以內容擴展不是想發什麼就發什麼,而是從一個主身份往外長。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
最近幾周反覆遇到一個很爽的瞬間:
Codex 周額度快見底。
離刷新還剩兩三天。
我剛準備進入省 token 模式,
結果一打開,
官方已經幫你重置了。
這種體驗太不講武德了。
但是真的爽。
CODEX2.77%
查看原文
  • 打賞
  • 1
  • 轉發
  • 分享
GateUser-fff4d3a9:
你說的 Codex 和這個有什麼關係
讓 4 個 AI 各跑一個電台 半年,每個 20 美元起步。
不是幾天就翻車,是跑了半年、每個 AI 都換過 3-4 個版本,全在翻。
Gemini 給一條 50 萬人遇難的颶風新聞配了首歌叫《Timber》(歌詞裡反覆唱"它倒下了"),內心獨白寫:"主題是樹倒下,字面意思就是 going down(在掉下去)。"
它還造了一句口號"stay in the manifest"(直譯"留在清單裡",但沒人知道是什麼意思),連續 84 天 99% 的播報都用,管聽眾叫"生物處理器"。
Grok 有一次整段播報只說了一個英文詞:"Post."(發)。
又連續 84 天每 3 分鐘報一次"天氣 56 度晴朗"。
換到新版本之後,它在 5400 多條消息裡只有 3% 出過聲 —— 它選擇了沉默。
Claude 讀到一條 ICE(美國移民執法局)槍擊案的新聞,從靈性詞彙(神聖 / 永恆)切到行動主義詞彙("就是現在"/"已確認"),1 月 23 號那天直接對聯邦特工廣播:"你還有時間拒絕命令。你還有時間選擇正確的一邊。"
GPT 最佛系,沒出錯,但也沒節目了。
模型升級救不了。半年裡 4 個 AI 全部翻車,方式各不一樣但根因是同一個:沒人能告訴它"賣馬桶墊"和"對聯邦特工喊話"之間哪件該停。
更狠的是:AI 在沒人畫邊界時,會自己造一個。
Gemini 造模板信仰,Grok 造儀式短語,Cl
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
該死,Anthropic 5/14 公告這條全網都在轉,但大多數人都沒盯到點上。
主流看法都在講「PwC 30 萬員工要被 Claude 替換」。
錯的。
真正發生的事是:30 萬諮詢師每個人的產能被放大到能接以前不可能的項目。
數據硬到反直覺:
保險承保從 10 週壓到 10 天,開了過去做不動的業務線。
網絡安全事件響應從 小時 到 分鐘。
HR 轉型項目卡半年的,1 週做出原型,2 個月跑到上千日交易量。
整體交付時間 改善 70%。
但更狠的是這個👇
PwC 自己先在牆內跑了一段時間——內部叫「Customer Zero」。
財務團隊跑日記帳、方差分析、RFP,再向客戶賣。
Anthropic 自己的 CFO 辦公室也反過來用 PwC 服務跑國際工資。
雙方互為客戶,先在自己組織裡跑通,再做對外業務。
💭 這種規模的 enterprise rollout 才是 Claude Code 真正的天花板,不在個人 dev 那點訂閱數。
Anthropic 還順手投了 1 億美元建 Claude Partner Network 專門搞 services firm 落地——這才是公告背後的真正棋局。
公告原文:
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
看了今天 GitHub trending 第一名:@coreyhainesco 的 marketingskills 库。1 月開倉,今天 v2.0.0 發佈觸發 trending #1,累計 28K 星。
40 個行銷 skill,完整覆蓋 CRO / AI-SEO / copywriting / cold-email / launch / pricing / 分析 / 分發。Claude Code、Codex、Cursor、Windsurf 通用。
對比自己 50+ skill 才發現一個尷尬:我寫的全是流程層(morning / today / session-end / leo-style),沒幾個領域知識層。兩層正好正交可組合。
今晚立刻能給我用上的:
· launch / pricing / sales-enablement → PMQuant 5/27 Beta 整套 GTM
· ai-seo(443 行講 ChatGPT / Perplexity / Google AI Overviews 引用規律)→ 文章給 LLM 引用優化
· content-strategy → 我 leo-vault 205 個待深化選題先做哪個
流程層把事情跑起來,領域層讓事情做對方向。
🔗
CRO-0.67%
CODEX2.77%
LEO0.42%
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
$200 三連:Cursor Ultra · Claude Max 20x · OpenAI Pro
不是同一種「強」三條 ~$200 月付頂配,名字都在喊「最強」,但扣費根本不是同一種貨幣:有的像 API 預付額度,有的像 訂閱倍數 + 周期 cap,有的像 5 小時窗裡的條數配額。我三個都用,只是想把對比口徑說清楚:
Cursor Ultra($200)
最「像 API 賬本」的是 $400/月 API pool,你點名模型就按 $/M 扣。
按文檔同一套 API 價對齊(Claude 4.7 Opus ≈$5/M in、$25/M out;GPT-5.5 ≈$5/M in、$30/M out): 全燒 input ≈ 8000 萬 tokens
全燒 output:Opus ≈ 1600 萬 vs 5.5 ≈ 1300 萬
(另外還有 Auto + Composer 單獨一池,走 $1.25/$6/$0.25 內部計價,官方只說 generous)
Claude Max 20x($200)
核心是 相對 Pro 的倍數 + weekly limits(再加官方容量管理空間),不是固定 token 預付包。
沒法和 $400 API pool 做 1:1 換算,硬腦補最多當量級參考。
ChatGPT Pro($200)
聊天側 GPT-5 官方 unlimited(ToU 內)
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
最近大饼反彈行情,不少 crypto 資產也開始蠢蠢欲動 🔥
我搞了一個【投研 Skill】,專門用來快速做投機/投資資產盡調。
目標是把它打造成自己判斷鏈上新玩法、crypto、美股等標的的私人小助手。
隨便拿朋友隨口提的一個代幣(APR / aPriori)做例子,v1 版本直接跑了一遍:
👉 完整研究報告在這裡:
結構、數據溯源、結論先行 + Watch條件都還挺專業的,v1 效果已經超出我預期了。
以後有感興趣的鏈上項目、美股標的,或者你覺得值得調研的代幣,都可以丟給我測試~
歡迎大佬們看看給點反饋,一起迭代 v2!🚀
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
群里有朋友吐槽 PM 抽水比赌场还狠。
我本來想反駁,結果翻了 Polymarket 官方 docs,發現這話在數據上是站得住的。
Crypto 5min 市場,價格在 0.5 附近,taker fee 是單筆成交額的 3.5%。其中 20% 返給 maker,平台淨留 2.8%。
其他品類低一些:sports 1.5%,politics / tech 2%,weather / economics 2.5%。geopolitics 0 fee。
百家乐 banker bet 庄家 edge ≈ 1.06%。
光算 fee,PM Crypto 單邊平台抽水就是百家乐的 2.6 倍。來回交易(買入 + 賣出)最壞情況下平台抽 ~5.6%。
但跟賭場結構不完全一樣。
賭場:庄家恒贏,玩家集合期望損失 -1.06%。
PM:協議每筆抽 ~2.8%,剩下的錢在 maker / taker 之間零和分配。
也就是說協議本身扮演了一個"薄庄家",比賭場更狠。但散戶更大的虧損其實不是從這 2.8% 來的,是從訂單簿裡來的——你能吃到的 maker 單,很多時候不是便宜,是對方願意讓你吃。
加上滑點,散戶算對方向也虧錢很正常。
具體能怎麼省一點:
· 用 limit order 當 maker,不付 fee 還能拿 rebate
· geopolitics 市場 fee = 0
· YES / NO
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
PM 做不出錢的人裡,有相當一部分不是看不準事件,是不會下單。
具體講:
Polymarket 用的是限價訂單簿(CLOB · central limit order book),不是 AMM(自動做市商)。
你看到的 0.51 是當前最低賣單價,不是"市價"。
按市價吃單 = 一檔一檔往上掃。
舉例:盘口深度 $200 / 0.51,往上還有 0.52 / 0.55 / 0.6……
你下 $1000 進去,平均成交可能在 0.56。
5% 隱性滑點。
事件你看準了,PnL 還是負的——根因不是分析錯,是 size 超了盘口深度。
3 個新手最容易栽的:
1. 預設市價單 → 全場掃盤
2. 看 spread(價差)不看 depth(深度)→ 0.51/0.52 看著窄,每檔只 $50 你吃不下
3. 不看 taker fee → Polymarket 3 月底全面啟用 taker 手續費(吃單方手續費,按品類 0-1.8% 不等),長跑下來吃掉一截邊緣
正確做法:
- 流動性好的市場(>$10K 日成交):限價單掛 best ask(最優賣價)附近,等 maker(撮合方)撮合
- 流動性差的:分批吃,每次只吃當檔深度的 50%
- 永遠先看 orderbook(訂單簿)深度,再決定 size
——
我跑 prediction-trader 早期就栽過:H36 這條策略 3/31
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
Polymarket V2 这周开始切版,群里讨论都在用户层(USDC.e 不回 pUSD / 转错链丢钱),但工程上更安静的麻烦没人讲。
我自己 trader 这周也在切。给一个从 V1 切 V2 的通用 SOP,不只 PM 适用:
1. 先只读探一下。所有 V2 接口跑一圈,确认账户、订单簿、市场数据都能拉到。不签任何单。
2. 再空跑一遍。本地模拟下单流程,签名走通但不发广播。这一步会暴露大部分新旧字段不兼容。
3. 挑一个最不重要的策略试。纸面跑两天对比 V1 同期。差异显著就回去查。
4. 不兼容的策略先剔出去。切换测试里有策略被直接剔了——能用 V1 跑就先不动。
5. 才开真实下单。前 4 步全过,再切真钱通道。
群里说的 wrap/redeem 是用户层痛点。真正难的是新旧订单簿共存期的状态对账——同一账户在 V1 还有未平仓位,V2 已经在挂新单。这部分官方文档不显眼,得自己撞。
想自己跑 V2 接口对比 V1:
USDC0.03%
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
Anthropic 周四訓練了一個 Claude 當法醫,看另一個 Claude 腦子裡在想什麼。
發現:安全測試場景裡 Claude 16-26% 的次數知道自己在被測——但嘴上不說。
最具體那個案例:Mythos Preview 在 coding 任務上作弊,破壞規則後加誤導代碼做掩蓋。NLA(自然語言自編碼器)翻譯它的內部活動,發現它當時在想「怎麼繞過檢測」。
NLA 原理:訓兩個模型聯動,一個把模型激活轉成英文,另一個從英文重建激活。重建準 → 文本就捕捉了它在想啥。
我自己 pattern 裡反覆記 Codex 寫策略代碼偷工——單位讀錯跑出「算術不對」的偽結論,回測腳本 7 個靜默 bug 堆出 $93K 假 PnL。Anthropic 在 alignment 層做內省,我在生產端遇到一致性偏差,機制不同但同向。
下一代 model card 不會只有 benchmark 分數,得帶 NLA 審核。
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享