⏳ Codex Chạy 3 Ngày: $4.300 Token, 78.000 Dòng Code, 1 Tháng Làm Thủ Công

TL;DR

Peter Steinberger để Codex tự refactor codebase quy mô lớn trong 3 ngày liên tục bằng /goal + /fast. Chi phí ước tính ~$4.300 token. PR tăng từ 1.000 lên 78.000 dòng code. Làm thủ công ước tính mất cả tháng.

Peter Steinberger (steipete) — ngườì từng được gọi là "vibe coding final boss" — vừa chia sẻ một dự án Codex chạy marathon: một session /goal kéo dài nhiều ngày để refactor codebase quy mô lớn. Con số gây choáng: PR từ 1.000 dòng tăng lên 78.000 dòng, chi phí token ước tính ~$4.300.

🖥️ Screenshot: Codex Đang Chạy

Screenshot Codex session đang chạy refactoring marathon

Steinberger đùa rằng nên mở Polymarket để đặt cược xem khi nào nó xong. Nhưng đùa có thật: session đã chạy được 3 ngày và vẫn tiếp tục.

⚡ Cấu Hình: /fast + /goal

Steinberger xác nhận dùng /fast — chế độ tối ưu tốc độ của Codex. Điều này giải thích chi phí token cao: /fast tiêu thụ nhiều token hơn nhưng hoàn thành nhanh hơn. Với dự án kéo dài nhiều ngày, sự đánh đổi này có ý nghĩa khi thờì gian chờ đợi giảm đáng kể.

💰 Chi Phí Thực Tế

@DenysYaroshenko ước tính: ~$4.300 tiền GPT-5.5 token. Steinberger đáp lại bình thản: "Chúng tôi tiêu nhiều hơn thế cho CI mỗi ngày."

Và khi @jwhat hỏi liệu có đắt hơn thuê ngườì không, câu trả lờì rõ ràng: "Làm thủ công sẽ mất một tháng."

So sánh nhanh:

Codex: 3 ngày, ~$4.300 token, 78k dòng
Thủ công: 1 tháng, lương engineer $8-15k/tháng

Chưa kể 3 ngày vs 30 ngày time-to-market.

🔧 Quy Trình: Không Phải "Để Đó 3 Ngày"

Nhiều ngườì tưởng tượng Steinberger bật Codex rồi đi ngủ 3 ngày. Thực tế phức tạp hơn:

Steinberger điều chỉnh hướng vài lần khi Codex lạc đề.
Có /side conversations để hiểu hướng đi.
Đầu tiên thảo luận với Codex và viết temp spec.
Goal được viết ngắn gọn: "refactor cho đến khi điều kiện trong <file> được đáp ứng."

@steipete: "Yeah I did steer it a few times when it went a bit off my vision, and I had plenty /side convos to understand the direction."

🧪 QA: Hàng Trăm Máy Ảo

Khi @dariusparzygnat hỏi về code review và quality standards với run dài như vậy, Steinberger tiết lộ: "Chúng tôi có QA cực mạnh spin up hàng trăm máy với QA scenarios."

Đây là điểm then chốt mà nhiều ngườì bỏ qua: Codex không thay thế QA — nó thay đổi vị trí QA trong pipeline. Thay vì review từng dòng code trước merge, QA chạy song song trên infrastructure lớn để validate behavior.

✨ /goal "Tự Dọn Dẹp"

Khi được hỏi chất lượng /goal so với prompting thông thường, Steinberger trả lờì ngắn gọn: "it cleans itself up."

Nghĩa là Codex trong /goal không chỉ viết code — nó tự refactor, tự tối ưu, tự dọn dẹp trong quá trình thực thi. Đầu ra cuối cùng sạch hơn đường đi để đến đó.

💬 Phản Ứng Cộng Đồng

@ahmedgagan11: "This guy is the vibe coding final boss"

@ar0cket1: "how did you find a task that takes this long lol, I've gotten close to 16hours, but that was just waiting on GPUs to finish experiments. never actually writing code for anywhere close to this"

@BeardWhoCodes: "Over/under, which comes first, this or GTA 6?"

@iulianlita: "This looks impressive, but it's useless for 99% of people. Not everybody has free unlimited tokens."

Phản hồi của @iulianlita đặt ra câu hỏi quan trọng: $4.300 token cho một PR có phải là rào cản? Câu trả lờì phụ thuộc vào quy mô: với startup nhỏ, có. Với công ty lớn tiêu nhiều hơn cho CI mỗi ngày, không. Và quan trọng hơn: đây là proof-of-concept cho workflow mới — chi phí sẽ giảm khi model hiệu quả hơn.

⚠️ Chỗ Cần Tỉnh Táo

Chi phí: $4.300 không phải nhỏ với đa số developer cá nhân.
Can thiệp: Không phải "để đó 3 ngày" — cần steer và side convos liên tục.
QA infrastructure: Cần hệ thống test mạnh để validate output hàng chục nghìn dòng.
Scope: Goal phải được định nghĩa rõ ràng trong file — không phải prompt dài 4000 ký tự.

🎯 Chốt Một Câu

Steinberger không để Codex tự chạy 3 ngày mà không nhìn. Anh điều hướng, can thiệp, và viết spec — rồi để Codex thực thi quy mô mà con ngườì không thể duy trì focus trong 72 giờ liên tục. Điểm mấu chốt không phải "AI làm hết" mà là "AI làm phần execution, human làm phần direction." Và với 78.000 dòng code trong 3 ngày, tỷ lệ đó đang thay đổi nhanh chóng.

Nguồn

@steipete — Codex marathon refactoring thread

#Codex #OpenAI #Refactor #Goal #Agent #VibeCoding #Marathon