1/ Anunciando o Open Dev Data, um conjunto de dados e ferramentas de código aberto para medir a atividade dos desenvolvedores em criptomoedas e na web descentralizada. A partir de 2025, vamos descontinuar o nosso Relatório Anual de Desenvolvedores e substituí-lo por esta plataforma que será atualizada continuamente. 🧵👇
2/ Desde 2019, a @electriccapital tem acompanhado ecossistemas de código aberto para entender onde os desenvolvedores estão a construir. Os nossos pipelines agora seguem milhares de ecossistemas, milhões de desenvolvedores e centenas de milhões de commits em quase tempo real.
3/ Esta plataforma fornece a protocolos, fundações, cientistas de dados e analistas as ferramentas para entender o seu ecossistema de desenvolvedores e contar a sua história a partir de uma única fonte de verdade.
4/ A plataforma tem dois produtos: 1. A taxonomia de repositórios de código aberto 2. As tabelas de dados que mostram dados de desenvolvedores e commits para esses repositórios Continuaremos a manter, alimentado por esta plataforma, para mostrar gráficos e métricas.
5/ Tudo começa com a taxonomia, uma taxonomia curada pela comunidade dos ecossistemas e repositórios de cripto, privacidade e web descentralizada. Em 2019, eram apenas alguns mantenedores internos. Hoje, tem mais de mil colaboradores.
6/ Em cima desta taxonomia, executamos agentes de IA que vasculham a web, GitHub, GitLab e redes sociais para descobrir novos projetos. Os humanos permanecem envolvidos para manter a qualidade alta, enquanto a automação nos proporciona cobertura e velocidade.
7/ A partir da taxonomia, executamos pipelines de dados contínuos que calculam métricas para cada repositório. Toda a tecnologia nesta parte da plataforma merece um post próprio um dia. - A impressão digital evita a contagem dupla. - A deduplicação de desenvolvedores lida com desenvolvedores de múltiplas identidades.
9/ Você pode baixar convenientemente o conjunto de dados de 40GB usando o pacote python: open-dev-data.
10/ A licença é simples. O código no repositório open-dev-data é licenciado sob MIT. Os conjuntos de dados são CC BY 4.0, portanto, você pode usá-los comercialmente desde que forneça a devida atribuição.
11/ Exemplos de casos de uso: - Comparar ecossistemas pela atividade de desenvolvedores ao longo do tempo - Medir o impacto de subsídios, hackathons ou programas de incentivo - Referenciação cruzada de implementações onchain de código com a atividade nos seus repositórios git associados. - Muitos mais...
13/ Siga @opendevdata para atualizações, novas funcionalidades e progresso na plataforma.
37,62K