script
config.py
: ファイルのパスや環境変数の設定, 集計期間の指定get_data.py
: GraphQL を使って Organization に紐づくリポジトリからデータを取得visualize.py
: ユーザ毎のPR数およびコメント数を集計し、結果を可視化query_template.txt
: Githubからデータを取得する際のクエリのテンプレートtarget_users.csv
: 集計対象のユーザを指定
output
: 集計結果のcsvデータとその可視化画像を格納する
- 環境構築
poetry install
script
配下に下記の形式の.env
を作成
- 内容
GITHUB_TOKEN="" ORGANIZATION="abeja-inc" ENDPOINT_GRAPHQL="https://api.github.com/graphql"
GITHUB_TOKEN
はアカウントの setting から発行できる Personal Access Token
- 集計期間の指定
config.py
のAnalyticsConfig
のdate_range
のデフォルト値を変更する- Sample)
date_range: tuple[datetime.date, datetime.date] = (datetime.datetime(2024, 4, 1).date(), datetime.datetime(2024, 8, 31).date())
- Sample)
- 集計対象のユーザを指定
- カラム名を
user_name
として、集計対象のユーザ一覧を csv データとして作成する
script
に移動してget_data.py
を実行し、 GitHub からデータを取得- 同じく
script
下でvisualize.py
を実行し、データの集計および可視化を実行 outputs
下に集計結果とその可視化画像が格納されるので確認