02.Python コーディング規約

このドキュメントでは、本プロジェクトでPythonを記述する際の、コーディングスタイルと規約について定めます。Webアプリケーション開発から、CI/CDの補助スクリプトまで、幅広い用途を想定しています。

Note

"共通原則との関係" 本規約は、01.共通コーディング原則 をPython言語に特化・具体化したものです。必ず共通原則にも目を通してください。

1. 基本方針 (Guiding Principles): PEP 8 準拠

本プロジェクトのコーディングスタイルは、基本的にPythonの公式スタイルガイドである PEP 8 に準拠します。
コードの可読性と一貫性を保つため、全てのPythonコードはPEP 8で定められたルールに従って記述してください。

2. レイアウトと書式設定 (Layout and Formatting)

手作業でのスタイル遵守は非効率であり、レビューのノイズとなるため、ツールによる規約の遵守を強制します。各ツールの設定は、リポジトリのルートに配置された pyproject.toml ファイルで一元管理します。また、エディタレベルでの基本的な設定は .editorconfig ファイルで統一します。

リンター兼フォーマッター: Ruff
- 役割: 非常に高速なリンター兼フォーマッター。PEP 8違反だけでなく、未使用の変数、未整理のimport、潜在的なバグやアンチパターンを検出します。Flake8, isort, pyupgrade など、多くのツールの機能を内包しています。
- 運用: Ruffを第一のツールとし、コードのチェックとフォーマットをこれ一つで行うことを推奨します。
- 公式サイト: Ruff - An extremely fast Python linter and code formatter
フォーマッター (代替): Black
- 役割: 「議論の余地なく（uncompromising）」コードを整形するフォーマッター。
- 運用: プロジェクトの歴史的経緯などでBlackが既に導入されている場合や、Ruffのフォーマッターがまだベータ版であることに懸念がある場合は、フォーマッターとしてBlackを、リンターとしてRuffを組み合わせて利用します。RuffはBlackと互換性のあるフォーマットを提供します。

!!! success "CI/CDによる自動チェック" GitHub Actionsのワークフローにruff check .やruff format --check .コマンドを組み込むことで、規約に違反したコードのマージを自動的にブロックします。

3. 命名規則 (Naming Conventions)

snake_case (スネークケース): 関数名、変数名、モジュール名。
PascalCase (パスカルケース): クラス名。
UPPER_SNAKE_CASE (大文字のスネークケース): 定数。

4.コメント (Comments)

Docstring ("""...""") の役割の限定:

本プロジェクトでは、02.設計仕様/01.API仕様 を仕様の正とし、ソースコードのDocstringはAPIドキュメント自動生成のためには使用しません。

Docstringは、あくまで関数やクラスの「目的」を簡潔に説明するための補助的な役割とします。型ヒントで自明な引数や戻り値の型を繰り返すような、冗長なDocstringは避けてください。

# 良い例：簡潔な一行Docstring
def calculate_tax(price: float, rate: float) -> float:
    """指定された価格と税率から税込価格を計算する。"""
    return price * (1 + rate)

# 悪い例：冗長なDocstring
def calculate_tax_bad(price: float, rate: float) -> float:
    """
    税込価格を計算します。
    :param price: 価格 (float)
    :param rate: 税率 (float)
    :return: 税込価格 (float)
    """
    return price * (1 + rate)

通常のコメント (#):
- コードが「何をしているか」よりも「なぜそうしているのか」という設計意図や背景、あるいは複雑なアルゴリズムの要点を説明するために使用します。

機能IDとの連携:

01.共通コーディング原則 で定められた通り、機能の実装やテストコードには、対応する機能IDをコメントやマーカーとして明記します。

# API-USER-2-1: ユーザー情報を返すAPI
def get_user_by_id(user_id: int) -> dict | None:
    """ユーザーIDに紐づくユーザー情報を取得する。"""
    # ...
    return None

import pytest
@pytest.mark.requirement("API-USER-2-1")
def test_get_user_by_id_returns_correct_user():
    # ...
    pass

5.言語機能の利用方針 (Language Feature Usage)

型ヒント (Type Hinting) の積極的利用:
- 全ての関数定義（引数と戻り値）で、Python を使ったユニオン型や、list[str] のような組み込みジェネリック型の利用を推奨します。
- 理由: コードの可読性と堅牢性が向上し、mypyやRuffによる静的解析の恩恵を最大限に受けられます。
```
# 良い例
def process_data(data: list[str] | None) -> int:
    if data is None:
        return 0
    return len(data)

# 悪い例 (型ヒントがない)
# def process_data(data):
#    ...
```

f-stringの利用:

文字列のフォーマットには、簡潔で可読性の高いf-stringを第一選択とします。

# 良い例
name = "World"
message = f"Hello, {name}!"

# 悪い例
message = "Hello, " + name + "!"
message = "Hello, {}!".format(name)

with文によるリソース管理:

ファイルやDB接続など、後処理が必要なリソースを扱う場合は、必ずwith文を使用し、リソースの確実な解放を保証します。

# 良い例
with open("data.txt", "r", encoding="utf-8") as f:
    content = f.read()
# ここでファイルは自動的にクローズされる

# 悪い例
# f = open("data.txt", "r", encoding="utf-8")
# try:
#     content = f.read()
# finally:
#     f.close() # finallyブロックが必要になり、冗長

データクラス (dataclasses):
- 主にデータを保持することを目的とするクラスには、@dataclassデコレータの利用を推奨します。__init__、__repr__等の自動生成により、ボイラープレートコードを削減できます。frozen=Trueでイミュータブルにすることを強く推奨します。
```
from dataclasses import dataclass

@dataclass(frozen=True)
class User:
    id: int
    name: str
    is_active: bool = True
```

構造的パターンマッチング (match文):

Python 3.10以降が利用可能な場合、複雑なif/elif/elseの連鎖を、より可読性の高いmatch文で置き換えることを検討します。

def process_command(command: dict):
    match command:
        case {"type": "create", "user": name}:
            print(f"Creating user {name}...")
        case {"type": "delete", "user_id": user_id}:
            print(f"Deleting user {user_id}...")
        case _:
            print("Unknown command.")

6.エラー処理と例外 (Error Handling and Exceptions)

エラーハンドリングは、try...exceptブロックを用いて行います。
except: のように裸のexceptで全ての例外を捕捉するのではなく、except ValueError: のように、想定される具体的な例外を捕捉してください。
独自の例外を定義する場合は、Pythonの組み込みExceptionクラスを継承し、例外クラスであることがわかるようにError接尾辞を付けることを推奨します (例: UserNotFoundError)。

# 良い例
try:
    user = find_user(user_id)
except UserNotFoundError as e:
    # ユーザーが見つからない場合の処理
    logger.warning(f"User not found: {e}")
except DatabaseConnectionError:
    # DB接続エラーの処理
    logger.error("Database is not available.")

# 悪い例：あらゆるエラーを握りつぶしてしまう
# try:
#     user = find_user(user_id)
# except:
#     # TypeErrorや他の予期せぬバグまで捕捉してしまい、問題の発見が遅れる
#     pass

7.非同期処理 (`async`/`await`)

7.1. 基本方針 (Basic Policy)

I/Oバウンドな操作（ネットワーク通信、データベースアクセスなど）や、長時間待機が発生する可能性のある処理では、スレッドをブロックしないように async と await を積極的に利用します。
Pythonの非同期処理は、単一のスレッド上でイベントループを用いて、多数のタスクを効率的に切り替えながら実行する協調的マルチタスクに基づいています。

7.2. コルーチンの定義と実行 (Defining and Running Coroutines)

定義 (Definition):
- 非同期関数（コルーチン）は async def を使って定義します。
実行 (Execution):
- コルーチンは await キーワードを使って呼び出します。await は async def で定義された関数内でのみ使用できます。
- トップレベルで非同期処理を開始するには、asyncio.run() を使用します。
タスクの並行実行 (Concurrent Execution):
- 複数のコルーチンを並行して実行したい場合は、asyncio.gather() や asyncio.create_task() を利用します。

import asyncio

async def fetch_data(url: str) -> str:
    print(f"Fetching {url}...")
    # 実際には aiohttp などで非同期なネットワークリクエストを行う
    await asyncio.sleep(1) # I/O処理をシミュレート
    return f"Data from {url}"

async def main():
    # 複数のタスクを並行実行
    results = await asyncio.gather(
        fetch_data("https://example.com/1"),
        fetch_data("https://example.com/2"),
    )
    print(results)

if __name__ == "__main__":
    asyncio.run(main())

7.3. キャンセルのサポート (`asyncio.CancelledError`) (Cancellation Support)

完了までに時間がかかる可能性のある非同期操作は、キャンセル要求を適切に処理できるように設計することを推奨します。
asyncio.Task オブジェクトの cancel() メソッドを呼び出すことで、タスクにキャンセルを要求できます。
キャンセルされたタスクは、await された箇所で asyncio.CancelledError を送出します。この例外を try...except ブロックで捕捉し、クリーンアップ処理を行うことができます。

import asyncio

async def long_running_task():
    try:
        for i in range(10):
            print(f"Working... {i}")
            await asyncio.sleep(1)
    except asyncio.CancelledError:
        print("Task was cancelled. Cleaning up...")
        # ここでリソースの解放などのクリーンアップ処理を行う
        raise

async def main():
    task = asyncio.create_task(long_running_task())
    await asyncio.sleep(3)
    task.cancel()
    try:
        await task
    except asyncio.CancelledError:
        print("Main caught cancellation.")

if __name__ == "__main__":
    asyncio.run(main())

7.4. CPUバウンドな処理との使い分け (Distinction from CPU-bound operations)

async/await は主に I/Oバウンドな処理の効率化に用います。
CPUを長時間占有するCPUバウンドな処理（重い計算など）を非同期コード内で実行すると、イベントループ全体がブロックされてしまいます。
このような処理は、loop.run_in_executor() (またはPython 3.9以降の asyncio.to_thread()) を使用して、別のスレッドやプロセスに処理を委譲することを強く推奨します。

import asyncio
import time

def cpu_bound_operation(duration: int):
    """CPUを長時間占有する同期関数"""
    print("CPU-bound operation started.")
    end_time = time.time() + duration
    while time.time() < end_time:
        pass # CPUを消費する重い計算をシミュレート
    print("CPU-bound operation finished.")

async def main():
    loop = asyncio.get_running_loop()
    # CPUバウンドな処理を別スレッドで実行し、イベントループをブロックしない
    await loop.run_in_executor(None, cpu_bound_operation, 2)
    print("Async operations can continue.")

if __name__ == "__main__":
    asyncio.run(main())

8.パフォーマンスに関する考慮事項 (Performance Considerations)

文字列結合 (String Concatenation):
- ループ内で多数の文字列を結合する場合は、+演算子やf-stringを繰り返し使用するのではなく、リストに一度追加してから"".join()メソッドを使用します。これは、文字列がイミュータブルであるため、+演算子では毎回新しい文字列オブジェクトが生成されるのを防ぐためです。
```
# 良い例
words = ["hello", "world", "this", "is", "a", "test"]
sentence = " ".join(words)

# 悪い例：ループのたびに新しい文字列オブジェクトが生成され、非効率
# sentence = ""
# for word in words:
#     sentence += word + " "
```
データ構造の選択 (Data Structure Choice):
- tuple vs list: 変更の必要がないシーケンスには、イミュータブルなtupleを使用することを検討します。tupleはlistよりもメモリ効率が良く、若干高速です。
- __slots__の利用: インスタンスが多数生成されるクラスでは、__slots__を定義することで、インスタンスごとの__dict__の作成を防ぎ、メモリ使用量を削減できます。
```
class Point:
    __slots__ = ["x", "y"]
    def __init__(self, x, y):
        self.x = x
        self.y = y
```
例外処理のコスト (Exception Cost):
- パフォーマンスが非常にクリティカルなコードパスでは、例外を通常の制御フローとして使用しないでください。try-exceptブロックは、特に例外が実際に発生した場合にオーバーヘッドを伴います。
- 例えば、辞書のキー存在チェックには、try-except KeyErrorよりもkey in dictやdict.get(key, default)を使用する方が高速です。
リスト内包表記とジェネレータ (List Comprehensions and Generators):
- 単純なforループでリストを作成するよりも、リスト内包表記を使用する方が一般的に高速で、可読性も高くなります。
- 非常に大きなデータセットを扱う場合は、一度に全ての要素をメモリに展開するリスト内包表記の代わりに、ジェネレータ式 (x for x in iterable) を使用します。これにより、メモリ使用量を大幅に削減できます。
```
# 良い例 (リスト内包表記): 簡潔で高速
squares = [x * x for x in range(1000)]

# 良い例 (ジェネレータ式): メモリ効率が良い
# 非常に大きなデータセットを扱う場合に推奨
squares_generator = (x * x for x in range(1_000_000))
for square in squares_generator:
    # １要素ずつ処理するため、巨大なリストをメモリに保持しない
    ...
```
適切な組み込み関数の利用 (Using Appropriate Built-in Functions):
- Pythonの多くの組み込み関数（例: sum(), map(), filter()）はC言語で実装されており、非常に高速です。
- 自前でループを実装する前に、同等の機能を持つ組み込み関数がないか検討してください。

9. その他 (Miscellaneous)

イミュータビリティ (Immutability):
- 可能な限り、イミュータブルなデータ構造の利用を検討します。
- 変更されるべきでないシーケンスには、listの代わりにtupleを使用します。
- @dataclassを使用する際は、frozen=Trueを指定することでイミュータブルなデータクラスを作成できます。
コメントアウトされたコード (Commented-out code):
- 不要になったコードは、コメントアウトして残さずに、Gitのバージョン管理で履歴を追跡してください。リポジトリをクリーンに保ちます。
リンターの警告の扱い (Handling Linter Warnings):
- Ruffやmypyが出力する警告やエラーは、原則として全て修正します。
- これらは潜在的なバグや、規約違反、非効率なコードを示唆しているため、無視せずに対応してください。
- 意図的に特定の警告を抑制する場合は、# noqa: [エラーコード] のように、理由を明記し、影響範囲を最小限に留めてください。