タプルとセットの基本を学ぼう

学習の目標

本章では、以下の内容を学習します。

タプルとは何かを理解する
タプルの作成方法と基本的な操作を習得する
セットとは何かを理解する
セットの作成方法と基本的な操作を学ぶ
リスト、辞書、タプル、セットの特徴と使い分けを理解する

これまで学んだデータ構造の復習

これまでに、リストと辞書という2つのデータ構造を学んできました。リストは複数の値を順番に管理し、インデックスを使ってアクセスします。辞書はキーと値の組み合わせでデータを管理し、キーを使ってアクセスします。

今回は、さらに2つの重要なデータ構造であるタプルとセットについて学んでいきます。これらのデータ構造にはそれぞれ独特の特徴があり、特定の場面で非常に有用です。

まず、それぞれの特徴を簡単に紹介しておきましょう。タプルはリストに似ていますが、一度作成すると変更できない（不変）という特徴があります。セットは重複を許さない値の集合を管理し、数学の集合演算のような操作が可能です。

これらのデータ構造を理解することで、プログラムでより適切なデータ管理ができるようになります。

タプルの基本概念と作成

タプルは、複数の値をまとめて管理するデータ構造です。リストと非常に似ていますが、最も重要な違いは一度作成すると内容を変更できないことです。

この「変更できない」特性を不変性（immutable）と呼びます。一方、リストは作成後に要素を変更できるため、可変性（mutable）があると言います。

タプルを作成するには、丸括弧()を使用し、値をカンマ,で区切ります。

VS Codeで新しいファイル tuple_set_basic.py を作成して、以下のコードを入力してみましょう。

# タプルの基本的な作成方法
coordinates = (10, 20)
print("座標:", coordinates)
print("データ型:", type(coordinates))

# 複数の異なるデータ型を含むタプル
student_info = ("田中太郎", 20, "情報科学", True)
print("学生情報:", student_info)

# 空のタプル
empty_tuple = ()
print("空のタプル:", empty_tuple)
print("長さ:", len(empty_tuple))

# 要素が1つのタプル（カンマが必要）
single_item = ("Python",)
print("単一要素のタプル:", single_item)
print("データ型:", type(single_item))

# カンマなしの場合（タプルにならない）
not_tuple = ("Python")
print("カンマなしの場合:", not_tuple)
print("データ型:", type(not_tuple))

このコードでは、タプルの様々な作成方法を示しています。座標のような2つの値をペアで管理する場合や、学生の基本情報のように関連する複数のデータをまとめる場合にタプルが便利です。

重要な点は、要素が1つだけのタプルを作成する場合は、要素の後にカンマが必要なことです。カンマがないと、Pythonは丸括弧を単なるグループ化として解釈し、タプルとして認識しません。

このプログラムをターミナルで実行してみてください。

python tuple_set_basic.py

実行結果は以下のようになります。

座標: (10, 20)
データ型: <class 'tuple'>
学生情報: ('田中太郎', 20, '情報科学', True)
空のタプル: ()
長さ: 0
単一要素のタプル: ('Python',)
データ型: <class 'tuple'>
カンマなしの場合: Python
データ型: <class 'str'>

実行結果から、タプルは丸括弧で表示され、単一要素の場合はカンマの有無でタプルかどうかが決まることが分かります。

タプルの要素へのアクセス

タプルの要素にアクセスする方法は、リストと全く同じです。インデックスを使って特定の要素を取得できます。

# タプルの要素にアクセス
colors = ("赤", "青", "緑", "黄色")
print("色のタプル:", colors)

# インデックスを使った要素の取得
print(f"最初の色: {colors[0]}")
print(f"2番目の色: {colors[1]}")
print(f"最後の色: {colors[-1]}")

# スライスを使った複数要素の取得
print(f"最初の2色: {colors[:2]}")
print(f"後半の色: {colors[2:]}")

# タプルの長さ
print(f"色の数: {len(colors)}")

# 要素の検索
if "青" in colors:
    position = colors.index("青")
    print(f"青の位置: {position + 1}番目")

このコードでは、リストと同じ方法でタプルの要素にアクセスしています。インデックス指定、負のインデックス、スライス、in演算子、index()メソッドなど、リストで使える操作の多くがタプルでも使用できます。

実行結果は以下のようになります。

色のタプル: ('赤', '青', '緑', '黄色')
最初の色: 赤
2番目の色: 青
最後の色: 黄色
最初の2色: ('赤', '青')
後半の色: ('緑', '黄色')
色の数: 4
青の位置: 2番目

タプルの不変性の確認

タプルが変更できないことを確認してみましょう。

# タプルの不変性を確認
numbers = (1, 2, 3, 4, 5)
print("元のタプル:", numbers)

# 要素の変更を試みる（エラーが発生する）
try:
    numbers[0] = 10
except TypeError as e:
    print(f"エラー: {e}")
    print("タプルの要素は変更できません")

# 要素の追加を試みる（エラーが発生する）
try:
    numbers.append(6)
except AttributeError as e:
    print(f"エラー: {e}")
    print("タプルにはappendメソッドがありません")

# 新しいタプルを作成することは可能
new_numbers = numbers + (6, 7)
print("新しいタプル:", new_numbers)
print("元のタプル:", numbers)  # 元のタプルは変更されない

このコードでは、タプルの要素を変更しようとしたり、新しい要素を追加しようとしたりしてエラーが発生することを確認しています。ただし、既存のタプルと新しい要素を組み合わせて新しいタプルを作成することは可能です。

実行結果は以下のようになります。

元のタプル: (1, 2, 3, 4, 5)
エラー: 'tuple' object does not support item assignment
タプルの要素は変更できません
エラー: 'tuple' object has no attribute 'append'
タプルにはappendメソッドがありません
新しいタプル: (1, 2, 3, 4, 5, 6, 7)
元のタプル: (1, 2, 3, 4, 5)

タプルの実用的な使い方

タプルの不変性は、データが誤って変更されることを防ぐのに役立ちます。特に、設定値や座標のような「変更すべきでないデータ」を管理するのに適しています。

# 設定情報をタプルで管理
config = ("localhost", 8080, "database_name", True)
host, port, db_name, debug_mode = config

print("=== サーバー設定 ===")
print(f"ホスト: {host}")
print(f"ポート: {port}")
print(f"データベース名: {db_name}")
print(f"デバッグモード: {debug_mode}")

# 複数の値を返す関数でタプルを使用
def get_student_info():
    name = "山田花子"
    grade = 2
    gpa = 3.8
    return name, grade, gpa  # タプルとして返される

# 戻り値を受け取る
student_name, student_grade, student_gpa = get_student_info()
print(f"\n=== 学生情報 ===")
print(f"名前: {student_name}")
print(f"学年: {student_grade}年")
print(f"GPA: {student_gpa}")

# タプル全体として受け取ることも可能
all_info = get_student_info()
print(f"すべての情報: {all_info}")

このコードでは、タプルの重要な活用例を示しています。設定情報のような変更すべきでないデータをタプルで管理することで、誤った変更を防げます。

また、関数から複数の値を返す際にタプルが自動的に使用されます。戻り値を複数の変数で受け取るアンパッキングという機能も便利です。

実行結果は以下のようになります。

=== サーバー設定 ===
ホスト: localhost
ポート: 8080
データベース名: database_name
デバッグモード: True

=== 学生情報 ===
名前: 山田花子
学年: 2年
GPA: 3.8
すべての情報: ('山田花子', 2, 3.8)

セットの基本概念と作成

セット（set）は、重複しない値の集合を管理するデータ構造です。数学の集合と同じような概念で、同じ値は1つしか保存できません。

セットには順序がなく、インデックスでアクセスすることはできません。主な用途は、重複の除去や集合演算（和集合、積集合など）です。

セットを作成するには、波括弧{}を使用し、値をカンマで区切ります。ただし、空のセットを作成する場合はset()関数を使用します。

# セットの基本的な作成方法
fruits = {"りんご", "バナナ", "オレンジ"}
print("果物セット:", fruits)
print("データ型:", type(fruits))

# 重複した値を含めて作成（重複は自動的に除去される）
numbers = {1, 2, 3, 2, 1, 4, 3}
print("数値セット:", numbers)
print("要素数:", len(numbers))

# 空のセット
empty_set = set()
print("空のセット:", empty_set)
print("データ型:", type(empty_set))

# 注意：空の波括弧は辞書になる
empty_dict = {}
print("空の波括弧:", empty_dict)
print("データ型:", type(empty_dict))

# リストからセットを作成（重複除去に便利）
list_with_duplicates = [1, 2, 2, 3, 3, 3, 4]
unique_numbers = set(list_with_duplicates)
print("重複ありリスト:", list_with_duplicates)
print("重複除去後セット:", unique_numbers)

このコードでは、セットの作成方法と重要な特徴を示しています。重複した値を含めてセットを作成しても、自動的に重複が除去されることが分かります。

また、リストからセットを作成することで、簡単に重複を除去できます。これは実際のプログラミングでよく使用される便利な機能です。

実行結果は以下のようになります。

果物セット: {'オレンジ', 'りんご', 'バナナ'}
データ型: <class 'set'>
数値セット: {1, 2, 3, 4}
要素数: 4
空のセット: set()
データ型: <class 'set'>
空の波括弧: {}
データ型: <class 'dict'>
重複ありリスト: [1, 2, 2, 3, 3, 3, 4]
重複除去後セット: {1, 2, 3, 4}

セットは順序を持たないため、表示される順序は必ずしも作成時の順序と同じではありません。

セットの基本操作

セットに対して要素の追加、削除、存在確認などの基本操作を行ってみましょう。

# セットの基本操作
colors = {"赤", "青", "緑"}
print("初期のセット:", colors)

# 要素の追加
colors.add("黄色")
print("黄色追加後:", colors)

# 既存の要素を追加（変化なし）
colors.add("赤")
print("赤を再追加:", colors)

# 複数の要素を一度に追加
colors.update(["紫", "オレンジ", "青"])  # 青は既存なので変化なし
print("複数追加後:", colors)

# 要素の削除
colors.remove("緑")
print("緑削除後:", colors)

# 存在しない要素を安全に削除
colors.discard("ピンク")  # エラーにならない
print("存在しない色を削除:", colors)

# 要素の存在確認
if "青" in colors:
    print("青は含まれています")

# セットの要素を順番に処理
print("すべての色:")
for color in colors:
    print(f"- {color}")

このコードでは、セットに対する様々な操作を示しています。 add()メソッドで単一要素を追加し、update()メソッドで複数要素を一度に追加できます。要素の削除にはremove()とdiscard()があり、discard()は存在しない要素でもエラーになりません。

実行結果は以下のようになります。

初期のセット: {'緑', '青', '赤'}
黄色追加後: {'緑', '青', '赤', '黄色'}
赤を再追加: {'緑', '青', '赤', '黄色'}
複数追加後: {'緑', '青', '赤', 'オレンジ', '黄色', '紫'}
緑削除後: {'青', '赤', 'オレンジ', '黄色', '紫'}
存在しない色を削除: {'青', '赤', 'オレンジ', '黄色', '紫'}
青は含まれています
すべての色:
- 青
- 赤
- オレンジ
- 黄色
- 紫

セットの集合演算

セットの最も強力な機能の一つは、数学の集合演算を簡単に実行できることです。和集合、積集合、差集合などの演算が可能です。

# 集合演算の例
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}

print("セットA:", set_a)
print("セットB:", set_b)
print()

# 和集合（どちらかに含まれる要素）
union_set = set_a | set_b
print("和集合 (A | B):", union_set)

# 積集合（両方に含まれる要素）
intersection_set = set_a & set_b
print("積集合 (A & B):", intersection_set)

# 差集合（AにあってBにない要素）
difference_set = set_a - set_b
print("差集合 (A - B):", difference_set)

# 対称差集合（どちらか一方にのみ含まれる要素）
symmetric_diff = set_a ^ set_b
print("対称差集合 (A ^ B):", symmetric_diff)

# メソッドを使った集合演算
print("\n=== メソッドを使った演算 ===")
print("和集合:", set_a.union(set_b))
print("積集合:", set_a.intersection(set_b))
print("差集合:", set_a.difference(set_b))
print("対称差集合:", set_a.symmetric_difference(set_b))

このコードでは、セットの集合演算を演算子とメソッドの両方で実行しています。これらの演算は、データ分析や条件に基づくフィルタリングなどで非常に有用です。

実行結果は以下のようになります。

セットA: {1, 2, 3, 4, 5}
セットB: {4, 5, 6, 7, 8}

和集合 (A | B): {1, 2, 3, 4, 5, 6, 7, 8}
積集合 (A & B): {4, 5}
差集合 (A - B): {1, 2, 3}
対称差集合 (A ^ B): {1, 2, 3, 6, 7, 8}

=== メソッドを使った演算 ===
和集合: {1, 2, 3, 4, 5, 6, 7, 8}
積集合: {4, 5}
差集合: {1, 2, 3}
対称差集合: {1, 2, 3, 6, 7, 8}

データ構造の使い分け

これまでに学んだリスト、辞書、タプル、セットの特徴を整理し、どのような場面で使い分けるべきかを理解しましょう。

# データ構造の特徴比較
print("=== データ構造の特徴比較 ===")

# リスト：順序あり、変更可能、重複許可、インデックスアクセス
shopping_list = ["牛乳", "パン", "卵", "牛乳"]  # 重複OK
print("リスト（買い物リスト）:", shopping_list)
shopping_list.append("バター")  # 変更可能
print("追加後:", shopping_list)

# タプル：順序あり、変更不可、重複許可、インデックスアクセス
coordinates = (10, 20)  # 座標のような固定データ
print("タプル（座標）:", coordinates)
x, y = coordinates  # アンパッキング
print(f"X座標: {x}, Y座標: {y}")

# セット：順序なし、変更可能、重複不可、インデックスアクセス不可
unique_tags = {"Python", "プログラミング", "学習", "Python"}  # 重複は除去
print("セット（一意なタグ）:", unique_tags)

# 辞書：キーと値のペア、順序保持（Python 3.7以降）、変更可能
student = {"name": "田中", "age": 20, "major": "情報科学"}
print("辞書（学生情報）:", student)

print("\n=== 使い分けの指針 ===")
print("リスト: 順序が重要で変更する可能性があるデータ")
print("タプル: 順序が重要だが変更しないデータ")
print("セット: 重複を許さない一意なデータの集合")
print("辞書: キーで識別したいデータ")

この比較により、各データ構造の特徴と適用場面が明確になります。

実行結果は以下のようになります。

=== データ構造の特徴比較 ===
リスト（買い物リスト）: ['牛乳', 'パン', '卵', '牛乳']
追加後: ['牛乳', 'パン', '卵', '牛乳', 'バター']
タプル（座標）: (10, 20)
X座標: 10, Y座標: 20
セット（一意なタグ）: {'学習', 'プログラミング', 'Python'}
辞書（学生情報）: {'name': '田中', 'age': 20, 'major': '情報科学'}

=== 使い分けの指針 ===
リスト: 順序が重要で変更する可能性があるデータ
タプル: 順序が重要だが変更しないデータ
セット: 重複を許さない一意なデータの集合
辞書: キーで識別したいデータ

実用的な活用例

最後に、タプルとセットを組み合わせた実用的な例を見てみましょう。

# 学生の履修科目管理
print("=== 履修科目管理システム ===")

# 学生情報（タプル：変更されない基本情報）
student1 = ("田中太郎", "ST001", 2)
student2 = ("佐藤花子", "ST002", 2)

# 履修科目（セット：重複なし）
subjects1 = {"数学", "英語", "プログラミング", "物理"}
subjects2 = {"数学", "化学", "プログラミング", "生物"}

print(f"学生1: {student1[0]} (学籍番号: {student1[1]})")
print(f"履修科目: {subjects1}")
print()

print(f"学生2: {student2[0]} (学籍番号: {student2[1]})")
print(f"履修科目: {subjects2}")
print()

# 共通履修科目（積集合）
common_subjects = subjects1 & subjects2
print("共通履修科目:", common_subjects)

# すべての履修科目（和集合）
all_subjects = subjects1 | subjects2
print("すべての履修科目:", all_subjects)

# 学生1のみが履修している科目
student1_only = subjects1 - subjects2
print("学生1のみの科目:", student1_only)

# 必修科目との比較
required_subjects = {"数学", "英語", "プログラミング"}
print("\n必修科目:", required_subjects)

# 各学生の履修状況チェック
for i, (student, subjects) in enumerate([(student1, subjects1), (student2, subjects2)], 1):
    missing = required_subjects - subjects
    if missing:
        print(f"学生{i} ({student[0]}): 未履修必修科目 {missing}")
    else:
        print(f"学生{i} ({student[0]}): すべての必修科目を履修済み")

この例では、変更されない学生の基本情報をタプルで管理し、重複を許さない履修科目をセットで管理しています。セットの集合演算を使って、共通科目の抽出や履修状況の確認を効率的に行えます。

実行結果は以下のようになります。

=== 履修科目管理システム ===
学生1: 田中太郎 (学籍番号: ST001)
履修科目: {'数学', 'プログラミング', '英語', '物理'}

学生2: 佐藤花子 (学籍番号: ST002)
履修科目: {'数学', 'プログラミング', '化学', '生物'}

共通履修科目: {'数学', 'プログラミング'}
すべての履修科目: {'数学', 'プログラミング', '英語', '物理', '化学', '生物'}
学生1のみの科目: {'英語', '物理'}

必修科目: {'数学', 'プログラミング', '英語'}
学生1 (田中太郎): すべての必修科目を履修済み
学生2 (佐藤花子): 未履修必修科目 {'英語'}

まとめ

本章では、タプルとセットの基本的な概念と操作について学習しました。理解できた内容は以下の通りです。

タプルは順序を持つ不変のデータ構造で、座標や設定値など変更すべきでないデータの管理に適していることを学びました。丸括弧を使って作成し、リストと同様にインデックスでアクセスできますが、作成後の変更はできません。

セットは重複を許さない値の集合で、重複の除去や集合演算に非常に有用であることを理解しました。波括弧を使って作成し、和集合、積集合、差集合などの数学的な演算が可能です。

また、リスト、辞書、タプル、セットそれぞれの特徴を比較し、データの性質や用途に応じて適切なデータ構造を選択することの重要性を学びました。

これで、Pythonの基本的なデータ構造についての理解が完成しました。次の章では、これらのデータ構造を使った制御構造について学んでいきます。

学習の目標

これまで学んだデータ構造の復習

タプルの基本概念と作成

タプルの要素へのアクセス

タプルの不変性の確認

タプルの実用的な使い方

セットの基本概念と作成

セットの基本操作

セットの集合演算

データ構造の使い分け

実用的な活用例

まとめ

Starterプランでより詳しく学習