1/ Ankündigung von Open Dev Data, einem Open-Source-Datensatz und Tool-Stack zur Messung der Entwickleraktivität im Bereich Krypto und im dezentralen Web. Ab 2025 stellen wir unseren eigenständigen jährlichen Entwicklerbericht ein und ersetzen ihn durch diese kontinuierlich aktualisierte Plattform. 🧵👇
2/ Seit 2019 verfolgt @electriccapital Open-Source-Ökosysteme, um zu verstehen, wo Entwickler tätig sind. Unsere Pipelines verfolgen jetzt Tausende von Ökosystemen, Millionen von Entwicklern und Hunderte von Millionen von Commits in nahezu Echtzeit.
3/ Diese Plattform bietet Protokollen, Stiftungen, Datenwissenschaftlern und Analysten die Werkzeuge, um ihr Entwickler-Ökosystem zu verstehen und ihre Geschichte aus einer einzigen Quelle der Wahrheit zu erzählen.
4/ Die Plattform hat zwei Produkte: 1. Die Taxonomie von Open-Source-Repositorys 2. Die Datentabellen, die Entwickler- und Commit-Daten für diese Repositorys anzeigen Wir werden weiterhin , unterstützt von dieser Plattform, Charts und Kennzahlen präsentieren.
5/ Alles beginnt mit der Taxonomie, einer von der Community kuratierten Taxonomie von Krypto-, Datenschutz- und dezentralen Web-Ökosystemen und Repos. 2019 war es eine Handvoll interner Betreuer. Heute hat es mehr als tausend Mitwirkende.
6/ Auf dieser Taxonomie setzen wir KI-Agenten ein, die das Web, GitHub, GitLab und soziale Medien durchsuchen, um neue Projekte zu entdecken. Menschen bleiben im Prozess, um die Qualität hoch zu halten, während die Automatisierung uns Reichweite und Geschwindigkeit verleiht.
7/ Aus der Taxonomie betreiben wir kontinuierliche Datenpipelines, die Metriken für jedes Repository berechnen. Alle Technologien in diesem Teil der Plattform verdienen eines Tages einen eigenen Beitrag. - Fingerprinting vermeidet doppelte Zählungen. - Entwickler-Deduplizierung kümmert sich um Entwickler mit mehreren Identitäten.
9/ Sie können das 40GB-Datenset bequem mit dem Python-Paket: open-dev-data herunterladen.
10/ Die Lizenzierung ist einfach. Der Code im open-dev-data Repository ist MIT-lizenziert. Die Datensätze sind CC BY 4.0, sodass Sie sie kommerziell nutzen können, solange Sie die richtige Attribution geben.
11/ Beispielanwendungsfälle: - Vergleichen von Ökosystemen anhand der Entwickleraktivität über die Zeit - Messen der Auswirkungen von Stipendien, Hackathons oder Anreizprogrammen - Querverweise zu Onchain-Bereitstellungen von Code mit Aktivitäten in ihren zugehörigen Git-Repos. - Viele weitere...
13/ Folge @opendevdata für Updates, neue Funktionen und Fortschritte auf der Plattform.
37,58K