我找到了一种方法,可以在 RTX 4090 GPU 上制作无审查的 AI 代理 (!!!),使用本地 30B 模型权重 这是 GLM-4.7-Flash,经过消融处理,需要 24GB VRAM,安全对齐从权重中手术移除,模型具有原生工具调用,实际上可以执行 bash,编辑文件,运行 git (1) 使用 ollama 拉取 GLM 的权重 > ollama pull huihui_ai/glm-4.7-flash-abliterated:q4_K (2) 通过 ollama 将其代理到任何编码代理 > ollama launch claude --model huihui_ai/glm-4.7-flash-abliterated:q4_K > ollama launch codex --model huihui_ai/glm-4.7-flash-abliterated:q4_K > ollama launch opencode --model huihui_ai/glm-4.7-flash-abliterated:q4_K (3) 玩得开心