Terug in de vroege dagen van Instagram, moesten alle IG-infra-engineers praktisch @justinbieber 's gebruikers-ID uit het hoofd leren... omdat elke keer dat Bieber postte, we tegen problemen met hot keys op CassandraDB aanliepen en Instagram crashten. 🥵🥵 Meerdere webservers probeerden dezelfde gegevens uit de cache op te halen (bijv. aantal likes), kregen een cache-miss en overspoelden allemaal de database, wat een klassiek thundering herd-probleem veroorzaakte. De oncalls hadden letterlijk een runbook: als er een waarschuwing afging, controleer of het Bieber's gebruikers-ID was, en voer dan een killswitch-operatie uit... Het bedienen van hot data is moeilijk, het bedienen van wereldwijd toegankelijke bronnen zoals tellers is moeilijk. Maar infrastructuurstacks zoals @Aptos zijn gebouwd om precies dit aan te kunnen, met Aggregators en Block-STM die kerncoördinatieproblemen op een native manier oplossen. En met @shelbyserves die de prestaties van dataverwerking nog verder optimaliseert en een nieuwe data-economie mogelijk maakt, ben ik enthousiast om te zien hoe Shelby + Aptos een belangrijke rol gaan spelen in het verstoren van de cloudbusiness in de toekomst. (P.S. Een groep engineers die aan het schalen van Instagram werkte, sloot zich later aan bij een project genaamd Libra/Diem, en belandde uiteindelijk bij @AptosLabs. Een van hen, @zekun000, is de Head of Blockchain bij Aptos en bouwt het Shelby-protocol)