GPT-5 được quảng cáo là làm giảm ảo giác và có vẻ như nó mang lại. 99.5 -> 99.9 ít hơn 80% lỗi. Tôi không biết tại sao mọi người không tạo ra một vấn đề lớn hơn từ điều này. Ảo giác là một trong những vấn đề lớn nhất của LLM và một số người nghĩ rằng chúng không thể giải quyết được.
OpenRouter
OpenRouter00:29 15 thg 8
Sau một tuần, GPT-5 đã đứng đầu bảng xếp hạng mô hình độc quyền của chúng tôi về độ chính xác khi gọi công cụ🥇 Đứng thứ hai là Claude 4.1 Opus, với 99.5% Chi tiết 👇
135,55K