runesleo

vip
Вік 8.5 Рік
Піковий рівень 6
Контент поки що відсутній
Цими днями я занурився в Fable 5 і переробив накопичений за пів року агентський воркфлоу: 7 агентів паралельно перевіряли, виявили 24 проблеми — три конфігурації суперечили одна одній, служба пам'яті вже два місяці була мертвою, але на неї все ще посилалися правила, захисник безпеки ніколи насправді нічого не блокував.
Потім я все виправив до кінця, скоротив правила на 62%, а навички, розкидані по чотирьох інструментах, об'єднав у єдине ціле.
Раніше таку роботу я робив сам тиждень, і то не завжди наважувався чіпати основну конфігурацію. Цього разу я лише схвалював рішення, а все виконувалося с
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Сьогодні ввечері мережа знову впала двічі. Chrome повністю червоний, Claude Code і Codex також впали.
У цей момент я виявив перевагу Cursor: він може відповідати навіть без VPN, і може діяти в локальній оболонці. Я дозволив йому запустити network-doctor: перевірити ping шлюзу, подивитися, чи TUN Clash напівзламаний, чи варто перезапустити mihomo або вимкнути TUN.
Ремонт мережі зазвичай складається з кількох циклів: «виявлення → виконання → перевірка стану». Якщо ви не активували платний ліміт Cursor, безкоштовного ліміту часто вистачає на кілька раундів діагностики.
Якщо цікаво, спробуйте вико
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Байка 5 використана до ліміту, що ж робити? Відчуваю, що раптово втратив напрямок.
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Вітаю, у нас з'явилася нова професія: аудитор агентів.
Найцікавіше в роботі AgentFlow — не те, що вони винайшли ще один робочий фреймворк, а те, що вони представили програми агентів як новий ланцюг постачання програмного забезпечення.
Раніше перевірка коду зводилася до того, чи викликає функція A функцію B.
Тепер шляхи стали складнішими:
Який промпт отримав користувацький ввід;
Який агент залежить від цього промпту;
Кому може передати завдання агент;
Чи може спільна пам'ять перенести брудний контекст;
Який інструмент врешті може записати файл, надіслати email, виконати команду.
Це те, що назив
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Я останнім часом, використовуючи інструменти для активів BTC L1, все більше відчуваю, що в гаманця є ще одна невирішена проблема:
Це не просто "точність відображення балансу".
Справжня складність у тому, що в одному UTXO може бути накладено кілька семантик активів.
Наприклад, сам BTC, inscription, Runes, Bitmap, Alkanes і навіть інтерпретація стану деяких додатків можуть бути пов'язані з одним і тим же виходом.
Bitcoin Core знає лише про UTXO.
Але користувач бачить "скільки в мене активів".
Тут виникає небезпечна ілюзія:
Активи, розпізнані платформою, не дорівнюють усім семантикам активів на ц
BTC-0,94%
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Ця стаття про прогнозування RL (навчання з підкріпленням) досить цікава.
Її можна розуміти так:
Взяти набір історичних прогнозів з уже відомими результатами, і змусити ШІ повернутися в той момент часу.
Але не можна дозволяти йому виходити в сьогоднішній інтернет, інакше він побачить відповіді.
Тому автор створив середовище «часової маски»:
Пошук може знаходити лише матеріали, доступні до того часу;
Веб-сторінки зчитуються через історичні знімки;
Фінансові та трендові дані також надаються лише в тому вигляді, в якому вони були на той момент.
Потім модель самостійно шукає інформацію, оцінює дока
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Один з найнебезпечніших сигналів у Claude Code:
Визначення 6 хвилин, високе зусилля, кілька сотень токенів.
Зазвичай це означає, що модель застрягла в болоті контексту. Далі легко виникають невідповідні відповіді, переплутування старих спогадів, шляхові галюцинації, неправильне читання виведення інструментів.
Не чекайте, поки вона "додумає".
Просто зупиніть, відкрийте нову сесію, запустіть знову з чистим контекстом.
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Невідомо, з чого почати прогнозування ринкових стратегій? Поділюся одним простим способом, яким користуюся щодня.
Спершу не поспішайте вивчати моделі та індикатори. Відкрийте рейтинг, щодня витягайте топ-кілька десятків лідерів у кожній категорії та зберігайте їх, не дивлячись лише на поточний день, а накопичуйте за один-два тижні.
Потім порівнюйте їх через кілька днів, виділяючи адреси, що з’являються знову і знову. Ігноруйте ті, що з’явилися лише один день, а ті, що постійно в топі — справді продовжують вигравати, це не просто вдача.
Чому не дивитися одразу на лідера? Я спеціально пере
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Сьогодні виявив дивну проблему: останнім часом Opus 4.8 працює з відчуттям "щось не так", якість відповідей коливається, іноді з’являються згадки про речі, яких я не запитував.
Після довгих пошуків з’ясував, що проблема в мені самому — 17 моїх скриптів Hook постійно засмічують контекст діалогу моделлю.
У Hook для Claude Code є два канали виводу. Один — для моделі, інший — тільки для вашого терміналу. Більшість людей, пишучи Hook, не звертають уваги на цю різницю, і за замовчуванням вивід йде через канал "для моделі".
Результат — кожного разу, коли ви викликаєте інструмент, Hook вставляє в конт
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Коли рівень активів Біткоїна починає ставати складнішим,
найперше з проблем, з якою стикаються звичайні користувачі, є:
Чи правильний баланс?
Це питання я нещодавно зустрів на Alkanes.
Одна й та сама адреса,
Subfrost, ESPO, UniSat, idclub
можуть показувати різний баланс і стан.
Деякі здаються завершеними.
Деякі — як би скасованими.
Деякі баланси оновлюються дуже повільно.
Я розбив свою транзакцію Alkanes
за txid / блок / outpoint,
і зрозумів, що по суті це одна й та сама група UTXO,
яка інтерпретується різними системами по-різному.
Баланс на фронтенді — це лише візу
BTC-0,94%
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Це надто незручно, Opus 4.8 має проблеми. А якщо ти просуваєш завдання за допомогою Fable, він постійно автоматично перемикає тебе на 4.8, блін, це дратує.
Чи тепер можна використовувати тільки 4.6?
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Codex цей ліміт здається досить цікавим.
У мене тут показано, що ліміт на цей тиждень вже 0%,
але поточна розмова ще може продовжуватися.
Поки не роблю висновків, можливо, кілька механізмів працюють разом:
Обмеження короткострокового вікна ще активне
Поточна сесія має резерв
Виклики локальних інструментів не повністю спільні з одним пулом
Відсоток у UI може бути округлений/затриманий
Статус віддаленого хоста ще зберігається
Ці деталі дуже схожі на реальну складність продукту Agent:
Користувач бачить чат-інтерфейс,
а за ним може стояти купа квот, сесій, інструментів, дозволів, стану хоста, що к
Переглянути оригінал
post-image
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
  • Закріплено