Dự án HVM-by-AI đã gặp phải một bức tường. Mọi thứ đang hoạt động trơn tru, nhưng chúng tôi gặp một vấn đề: trình thông dịch C là đệ quy, có nghĩa là nó tràn ngăn xếp cho các chương trình lớn. Tôi đã yêu cầu AI chuyển nó thành một trình thông dịch dựa trên ngăn xếp/thao tác thủ công, nhưng nó đã thất bại. May mắn thay, HVM3 đã có trình thông dịch như vậy! Vì vậy, tôi đã cung cấp cho nó các phần liên quan của HVM3 và yêu cầu nó chuyển đổi. Tất cả những gì nó cần làm là điều chỉnh mã cũ cho phù hợp với mã mới. Thật không may, ngay cả với gợi ý lớn này, AI lại thất bại một lần nữa. Sau đó, tôi đã tạo ra 3 phiên bản và yêu cầu chúng gỡ lỗi, và chỉ dừng lại khi đầu ra là chính xác. Tôi thậm chí đã cung cấp cho chúng công cụ để so sánh từng bước thực thi. Tất cả 3 đều thất bại. Tôi đoán đây là giới hạn... Tôi biết có lẽ tôi có thể tự làm điều đó trong một hoặc hai giờ, nhưng, nếu tôi không thể? Tôi thực sự muốn tìm ra liệu một chiếc máy tính có thể tự giải quyết vấn đề này hay không, vì khoa học. Tôi đã hết ý tưởng, tuy nhiên: GPT-5 high là mô hình thông minh nhất mà chúng tôi có. Nếu nó không thể giải quyết vấn đề này, thì còn gì khác có thể? Có lẽ 256 phiên bản? Có lẽ áp dụng tinh chỉnh thời gian thử nghiệm cho một mô hình khác?
Taelin
Taelin21 thg 8, 2025
Nhân tiện, tôi gần như đã ngừng sử dụng Opus hoàn toàn và bây giờ tôi có vài tab Codex với GPT-5-high đang làm việc trên các nhiệm vụ khác nhau trong 3 codebase (HVM, Bend, Kolmo). Tiến độ chưa bao giờ mạnh mẽ đến vậy. Công việc của tôi bây giờ chủ yếu là giao các nhiệm vụ được xác định rõ cho Codex và xem xét các đầu ra của nó. OpenAI không trả tiền cho tôi và cũng không quan tâm đến tôi. Mô hình này thực sự rất tốt và thực tế là mọi người không thể nhận ra điều đó khiến tôi nhận ra rằng hầu hết các bạn có lẽ đang sử dụng chatbot như bạn gái hoặc một cái gì đó khác ngoài việc hỗ trợ các nhiệm vụ lập trình phức tạp.
106,27K