熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
不要聽任何反對者的話,Gemini 3 在各種編碼任務上都非常出色。從網頁應用的 UI、使用 Swift 的 iOS 開發、Python 的後端代碼,任何與 AI/ML 相關的事情等等。它真的很強大,擅長遵循規則和使用工具。
似乎每當一個主要的前沿模型發布時,一堆試圖追求名聲的人就會談論它有多麼「令人失望」,以及它如何未能完成他們的專屬任務。通常你會發現他們在提示方面表現糟糕,或者他們的任務根本是愚蠢的,與現實生活毫無關聯。
有一些例外,比如 Llama4,對於任何試用三分鐘的人來說顯然是糟糕的。但人們對 GPT-5 也這麼說,結果顯然是錯的。這就像股市一樣,人們因為持懷疑和反對的態度而獲得更多關注。負面情緒能賣錢。
對於編碼來說,重要的是這個模型對於已經擅長使用類似模型進行軟體開發的人來說有多好,以及他們在多種現實的、真實世界的任務上嘗試幾個小時後的理性意見,而不是那些愚蠢的陷阱問題。
而且需要一些真正的時間和大量獨立的試驗,才能真正看到模型的一致性和自主性,它展現了多少主動性和「毅力與決心」(這也與代理的使用有關,因此是 Cursor 與 Gemini-CLI 的比較),以及它在工具上的可靠性。
Gemini 3 在所有這些方面都表現出色。Google 透過這個模型為自己創造了巨大的市場價值,特別是因為他們能夠在自己的定制矽晶片上以成本價來承載它。
其他人要達到這個價格-性能曲線的點將會非常困難(幾乎不可能)。即使GPT-6在某種程度上更聰明,支付了“英偉達稅”並給了詹森90%的毛利後,OpenAI的托管成本仍將使其在帕累托原則上無法達標。
7.62K
熱門
排行
收藏

