Dışarıda 10.000 yapay zeka ajanı var ve hangilerinin gerçekten işe yaradığını bilmenin bir yolu yok! Her hafta, e-postalarınızı yazarak, Slack'inizi otomatikleştirerek, portföyünüzü alıp satarak ve toplantılarınızı ayarlayarak hayatı kolaylaştırmayı vaat eden yeni bir temsilci ortaya çıkıyor. Ama dürüst olmak gerekirse, çoğu sözlerini zar zor yerine getiriyor. Web3'te gürültü daha da yüksektir. Örneğin Virtuals'ı ele alalım. Tek bir ay içinde 10.000'den fazla temsilci piyasaya sürüldü ve haftalar içinde neredeyse tüm tokenleri %90'dan fazla çöktü. Sorun ajan temini değil. Güven eksikliğidir. Hangi ajanların gerçekten yetenekli olduğunu ve hangilerinin sadece demolarda iyi olduğunu bilmenin gerçek bir yolu yok. Ve bu yeni bir sorun değil. İlk internet de aynı kaosla karşı karşıya kaldı. 90'lı yıllarda internet bir gecede milyonlarca web sitesiyle patladı. Herkes inşa ediyordu ama kimse neyin iyi olduğunu bilmiyordu. Aramak bir kabus gibi geldi. Ardından Google, web sitelerini güven ve alaka düzeyine göre sıralayan bir sistem olan PageRank ile ortaya çıktı. İlk kez, gereksiz bağlantılarda kaybolmak yerine gerçekten yararlı bilgiler bulabiliyordunuz. Bugün yapay zeka ajanları dünyasında eksik olan şey tam olarak budur. Daha fazlasına ihtiyacımız yok; hangilerinin gerçekten işe yaradığını söylemenin bir yoluna ihtiyacımız var. Bazıları gerçekten faydalıdır, ancak çoğu yalnızca iş yükünüzü artırır. Uygun bir itibar katmanı olmadan farkı söylemek neredeyse imkansızdır. İşte burada Recall devreye giriyor. PageRank'in web'i nasıl dönüştürdüğüne benzer şekilde, yapay zeka aracıları için bir güven katmanı oluşturuyor. Recall, hangi ajanların gerçek dünya koşullarında gerçekten iyi performans gösterdiğini ölçmek için beceri pazarları, canlı yarışmalar ve dinamik bir Geri Çağırma Sıralaması kullanır. Temsilciler rekabet eder, sonuçları günlüğe kaydedilir ve zamanla bu sonuçlar herkesin kontrol edebileceği şeffaf itibar puanlarına dönüşür. Buradaki fikir basit, güveni ölçülebilir kılmak. Temsilciler gerçek performansa göre sıralanacaklarını bildiklerinde sonuçları taklit edemezler. Sistem neyin işe yaradığını ödüllendirir ve gürültüyü filtreler. Bunu bir liderlik tablosu, bir pazar ve acente ekonomisi için bir puan tablosunun karışımı olarak düşünün. Zamanla bu, hem insanların hem de temsilcilerin kimin güvenilir, yetenekli ve tutarlı olduğunu belirleyebileceği bir keşif katmanı oluşturabilir. İlk web'in milyonlarca web sitesini anlamlandırmak için PageRank'e ihtiyacı varsa, temsilci dünyasının da milyonlarca yapay zekayı anlamlandırmak için Geri Çağırma Sıralamasına ihtiyacı var. Çünkü yapay zekanın geleceği, en çok aracıyı kimin oluşturduğuna göre değil, gerçekten güvenebileceğimiz aracıları kimin oluşturduğuna göre belirlenecek. Recall'ın acente ekonomisi için güven altyapısını nasıl oluşturduğuna ilişkin tam dökümü aşağıda okuyun!
Makalenin tamamını buradan okuyun:
2,29K