1/ Open Dev Dataの発表:暗号通貨および分散型ウェブにおける開発者活動を測定するためのオープンソースデータセットおよびツールスタック。 2025年からは、独立した年次開発者レポートを廃止し、この継続的に更新されるプラットフォームに置き換えます。 🧵👇
2/ 2019年以降、@electriccapitalはオープンソースのエコシステムを追跡し、開発者がどこで構築しているかを理解しています。 私たちのパイプラインは現在、数千のエコシステム、数百万の開発者、数億件のコミットをほぼリアルタイムで追跡しています。
3/ このプラットフォームは、プロトコル、財団、データサイエンティスト、アナリストに開発者エコシステムを理解し、単一の真実の源からストーリーを伝えるためのツールを提供します。
4/ プラットフォームには2つの製品があります: 1. オープンソースリポジトリの分類法 2. それらのリポジトリの開発者データとコミットデータを表示するデータテーブル このプラットフォームを活用し、チャートや指標の展示を継続して行い続けます。
5/ すべてはタクソノミーから始まります。これは、暗号資産、プライバシー、分散型ウェブエコシステムやリポジトリのコミュニティがキュレーションした分類法です。 2019年は数名の内部メンテナンス担当者でした。現在では1,000人以上の寄稿者がいます。
6/ この分類法に加えて、ウェブ、GitHub、GitLab、ソーシャルメディアをスキャンして新しいプロジェクトを発見しるAIエージェントを運用しています。 人間は品質を維持するために情報共有を続け、自動化はカバレッジとスピードをもたらします。
7/ タクソノミーから、各リポジトリごとにメトリクスを計算する連続データパイプラインを運用しています。 このプラットフォームのこの部分の技術は、いつか別の投稿に値します。 - 指紋採取は二重カウントを回避する。 - 開発者による重複除去は、複数アイデンティティ開発者を扱います。
9/ 40GBのデータセットはpythonパッケージopen-dev-dataを使って簡単にダウンロードできます。
10/ ライセンスは簡単です。 オープン開発データリポジトリのコードはMITライセンスです。 データセットはCC BY 4.0なので、適切な帰属を付ければ商用で使えます。
11/ ユースケース例: - 開発活動ごとにエコシステムを比較する - 助成金、ハッカソン、インセンティブプログラムの影響を測定する - コードのオンチェーン展開と、関連するgitリポジトリでの活動を照合すること。 - もっとたくさん...
13/ @opendevdataをフォローして、最新情報、新機能、プラットフォームの進捗情報をお届けします。
37.57K