1/ 宣布 Open Dev Data,这是一个开源数据集和工具栈,用于衡量加密和去中心化网络中的开发者活动。 从2025年开始,我们将停止发布独立的年度开发者报告,并用这个持续更新的平台替代它。 🧵👇
自2019年以来,@electriccapital 一直在跟踪开源生态系统,以了解开发者在哪里进行构建。 我们的管道现在几乎实时地跟踪数千个生态系统、数百万个开发者和数亿次提交。
这个平台为协议、基金会、数据科学家和分析师提供了工具,以理解他们的开发者生态系统,并从单一的真实来源讲述他们的故事。
4/ 该平台有两个产品: 1. 开源代码库的分类法 2. 显示这些代码库的开发者和提交数据的数据表 我们将继续维护,由该平台提供支持,以展示图表和指标。
5/ 一切都始于分类法,这是一个由社区策划的加密、隐私和去中心化网络生态系统及其代码库的分类法。 在2019年,它只有少数内部维护者。今天,它拥有超过一千名贡献者。
在这个分类法之上,我们运行 AI 代理,扫描网络、GitHub、GitLab 和社交媒体,以发现新项目。 人类保持参与,以确保质量高,而自动化则为我们提供覆盖和速度。
7/ 从分类法中,我们运行持续的数据管道,为每个仓库计算指标。 平台这一部分的所有技术都值得将来单独写一篇文章。 - 指纹识别避免了重复计算。 - 开发者去重处理多身份开发者。
9/ 您可以方便地使用 python 包下载 40GB 数据集:open-dev-data。
10/ 许可很简单。 open-dev-data 仓库中的代码采用 MIT 许可证。 数据集采用 CC BY 4.0 许可证,因此您可以在商业上使用它们,只要您给予适当的署名。
11/ 示例用例: - 随时间比较生态系统的开发活动 - 衡量资助、黑客马拉松或激励计划的影响 - 将链上代码的部署与其相关的 git 仓库活动进行交叉引用。 - 还有更多...
13/ 关注 @opendevdata 获取更新、新功能和平台进展。
37.59K