# 1-7. アルゴリズム - ソートアルゴリズム（バブルソート、選択ソート、挿入ソート、マージソート）

あるデータ群を何らかの情報に沿ってある順番に並び替えることをソートという．
機械的にソートを行うためには様々なアルゴリズムが考えられるため，それらがどのように実装されるのか確認し，ソートにかかる時間も見てみよう．

## データセットの準備


以下では，[メディア芸術データベースのデータ](https://github.com/mediaarts-db/dataset)を利用し，「ONE PIECE」のマンガタイトルを出版日順にソートしていく．
上記のリンクから「マンガ単行本」の「.json」ファイルをダウンロードした後，このノートブックにアップロードしよう．

※「1-4. 単回帰分析」，「1-4. ロジスティック回帰分析」，「1-5. 1～3次元の図表化」,「1-5. 関係性の可視化（ネットワーク構造）」，「1-7. ソートアルゴリズム」，「1-7. 探索アルゴリズム」，「2-5. データ加工」，「3-3. 機械学習」は同じデータセットを利用するため，もし同じものを持っている場合は以下の取得作業は不要である．そちらをアップロードしよう．

ファイルサイズがとても大きいためアップロードには時間がかかる．ファイル名が反映されたことを確認するだけでなく，ファイルアップロード時の画面の下部にあるアップロードの進捗を示す円形のバーが全て進行するまで待ってから作業しよう．（およそ30分程度）

In [None]:
import json
import copy
import time

In [None]:
# ファイルを開き，読み込む
j_file=open('/content/metadata_cm-item_cm101.json')
df = json.load(j_file)

# 漫画のデータは'@graph'配下にあるので，そこを切りだす
comics=df['@graph']

In [None]:
# ONE PIECEのタイトルを格納するリスト
onepiece=[]

# comicsデータ内の各要素（comic）を順番に見ていく
# 「タイトルに"ONE PIECE"が入っている」かつ「出版日のデータがあるもの」を"onepiece"リストに格納していく
for comic in comics:
  if('ONE PIECE' in comic['rdfs:label']):
    if('schema:datePublished' in comic.keys()):

      date=comic['schema:datePublished']
      date=date.replace('-','')
      date=date[0:6]
      onepiece.append([comic['rdfs:label'],int(date)])

In [None]:
onepiece #before sort

[['ONE PIECE FILM STRONG WORLD 下', 201012],
 ['ONE PIECE FILM STRONG WORLD 上', 201012],
 ['ONE PIECE THE MOVIE カラクリ城のメカ巨兵', 200611],
 ['ONE PIECE THE MOVIE エピソードオブチョッパー+冬に咲く、奇跡の桜', 200911],
 ['ONE PIECE 巻61', 201102],
 ['ONE PIECE 巻60', 201011],
 ['ONE PIECE 巻59', 201008],
 ['ONE PIECE 巻58', 201006],
 ['ONE PIECE 巻56', 200912],
 ['ONE PIECE 巻55', 200909],
 ['ONE PIECE 巻54', 200906],
 ['ONE PIECE 巻53', 200903],
 ['ONE PIECE 巻52', 200812],
 ['ONE PIECE 巻51', 200809],
 ['ONE PIECE 巻50', 200806],
 ['ONE PIECE 巻49', 200803],
 ['ONE PIECE 巻48', 200712],
 ['ONE PIECE 巻47', 200709],
 ['ONE PIECE 巻45', 200703],
 ['ONE PIECE 巻46', 200707],
 ['ONE PIECE 巻57', 201003],
 ['ONE PIECE 巻44', 200612],
 ['ONE PIECE 巻43', 200609],
 ['ONE PIECE 巻42', 200607],
 ['ONE PIECE 巻41', 200604],
 ['ONE PIECE 巻40', 200512],
 ['ONE PIECE 巻39', 200511],
 ['ONE PIECE 巻38', 200507],
 ['ONE PIECE 巻36', 200502],
 ['ONE PIECE 巻35', 200411],
 ['ONE PIECE 巻34', 200408],
 ['ONE PIECE 巻33', 200406],
 ['ONE PIECE 巻32', 200403]

## ソート


###バブルソート

In [None]:
# onepieceリストのコピーを作り，それをソートする
copy_onepiece = copy.deepcopy(onepiece)

# 時間計測開始
start = time.time()

# 要素を頭から順番に見ていく
for i in range(len(copy_onepiece)-1):
  # copy_onepiece[0]~[終端]の中で，値の大きいものを次の値と交換するということを繰り返し，最大値を持つものを終端に追いやる
  # 終端側（値の大きい方）のi個がソート済みになるので，新しく最大値が終端に追いやられるたびに終端の位置を一つ手前にする（=len(copy_onepiece)-1-iの意図）
  for j in range(len(copy_onepiece)-1-i):
    if copy_onepiece[j][1]>copy_onepiece[j+1][1]:
      tmp1=copy_onepiece[j]
      tmp2=copy_onepiece[j+1]
      copy_onepiece[j]=tmp2
      copy_onepiece[j+1]=tmp1

# 時間計測終了
print("計算時間: ", time.time() - start)

copy_onepiece

計算時間:  0.003807544708251953


[['ONE PIECE 巻1', 199712],
 ['ONE PIECE 巻2', 199804],
 ['ONE PIECE 巻3', 199806],
 ['ONE PIECE 巻4', 199808],
 ['ONE PIECE 巻5', 199810],
 ['ONE PIECE 巻6', 199812],
 ['ONE PIECE 巻7', 199903],
 ['ONE PIECE 巻8', 199905],
 ['ONE PIECE 巻9', 199907],
 ['ONE PIECE 巻10', 199910],
 ['ONE PIECE 巻11', 199912],
 ['ONE PIECE 巻12', 200002],
 ['ONE PIECE 巻13', 200005],
 ['ONE PIECE 巻14', 200007],
 ['ONE PIECE 巻15', 200009],
 ['ONE PIECE 巻16', 200012],
 ['ONE PIECE 巻17', 200102],
 ['ONE PIECE 巻18', 200104],
 ['ONE PIECE 巻19', 200107],
 ['ONE PIECE 巻20', 200109],
 ['ONE PIECE 巻21', 200112],
 ['ONE PIECE RED', 200201],
 ['ONE PIECE 巻22', 200202],
 ['ONE PIECE 巻23', 200204],
 ['ONE PIECE 巻24', 200207],
 ['ONE PIECE 巻25', 200209],
 ['ONE PIECE 巻26', 200212],
 ['ONE PIECE 巻27', 200302],
 ['ONE PIECE 巻28', 200305],
 ['ONE PIECE 巻29', 200307],
 ['ONE PIECE 巻30', 200310],
 ['ONE PIECE COLOR WALK 2', 200311],
 ['ONE PIECE 巻31', 200312],
 ['ONE PIECE 巻32', 200403],
 ['ONE PIECE 巻33', 200406],
 ['ONE PIECE 巻34', 2

###選択ソート

In [None]:
# onepieceリストのコピーを作り，それをソートする
copy_onepiece = copy.deepcopy(onepiece)

# 時間計測開始
start = time.time()

# 頭から順番に要素を見ていく
for i in range(len(copy_onepiece)-1):
  # 今見ている要素copy_onepiece[i]の出版日をとりあえずの最小値としておく
  tmp=copy_onepiece[i]
  min=copy_onepiece[i][1]
  index=i
  # copy_onepiece[i]よりも後の全ての要素（copy_onepiece[j],...）を順番に見ていく
  # 今最小値としているものよりも小さい値を持つデータがあれば，それを最小値として覚え直す
  for j in range(i+1,len(copy_onepiece)):
    if copy_onepiece[j][1]<min:
      min=copy_onepiece[j][1]
      index=j
  # 最小値を持つデータとi番目のデータと交換する
  copy_onepiece[i]=copy_onepiece[index]
  copy_onepiece[index]=tmp

# 時間計測終了
print("計算時間: ", time.time() - start)

copy_onepiece

計算時間:  0.0013833045959472656


[['ONE PIECE 巻1', 199712],
 ['ONE PIECE 巻2', 199804],
 ['ONE PIECE 巻3', 199806],
 ['ONE PIECE 巻4', 199808],
 ['ONE PIECE 巻5', 199810],
 ['ONE PIECE 巻6', 199812],
 ['ONE PIECE 巻7', 199903],
 ['ONE PIECE 巻8', 199905],
 ['ONE PIECE 巻9', 199907],
 ['ONE PIECE 巻10', 199910],
 ['ONE PIECE 巻11', 199912],
 ['ONE PIECE 巻12', 200002],
 ['ONE PIECE 巻13', 200005],
 ['ONE PIECE 巻14', 200007],
 ['ONE PIECE 巻15', 200009],
 ['ONE PIECE 巻16', 200012],
 ['ONE PIECE 巻17', 200102],
 ['ONE PIECE 巻18', 200104],
 ['ONE PIECE 巻19', 200107],
 ['ONE PIECE 巻20', 200109],
 ['ONE PIECE 巻21', 200112],
 ['ONE PIECE RED', 200201],
 ['ONE PIECE 巻22', 200202],
 ['ONE PIECE 巻23', 200204],
 ['ONE PIECE 巻24', 200207],
 ['ONE PIECE 巻25', 200209],
 ['ONE PIECE 巻26', 200212],
 ['ONE PIECE 巻27', 200302],
 ['ONE PIECE 巻28', 200305],
 ['ONE PIECE 巻29', 200307],
 ['ONE PIECE 巻30', 200310],
 ['ONE PIECE COLOR WALK 2', 200311],
 ['ONE PIECE 巻31', 200312],
 ['ONE PIECE 巻32', 200403],
 ['ONE PIECE 巻33', 200406],
 ['ONE PIECE 巻34', 2

###挿入ソート

In [None]:
# 新しいリストを作り，そこにソートしたものが入っていく
sorted_onepiece = []

# 時間計測開始
start = time.time()

# 先頭の次の要素から順番に見ていく
for i in range(len(onepiece)):
  flag=True
  tmp=onepiece[i][1]
  # 一番最初の操作は，onepieceの最初の要素をsorted_onepieceにコピーするだけ
  if i ==0:
    sorted_onepiece.append(onepiece[i])
    flag=False

  index=0
  j=0

  # 2巡目以降の操作では，sorted_onpiece（ソート済みのonepiece[0]~[i-1]のリスト）を先頭から見ていき，今見ているonepieceのi番目の要素tmpが入るべき位置にたどり着いたら挿入する
  while flag:
    # 最後まで見切ってしまった時の終了条件
    if j==i+1:
      index=j
      flag=False
    # 挿入するべき位置が見つかった時の終了条件
    elif sorted_onepiece[j][1]>tmp:
      index=j
      flag=False
    # 比較する位置をずらす
    j=j+1
  sorted_onepiece.insert(index,onepiece[i])

# 時間計測終了
print("計算時間: ", time.time() - start)

sorted_onepiece

計算時間:  0.0015192031860351562


[['ONE PIECE 巻1', 199712],
 ['ONE PIECE 巻2', 199804],
 ['ONE PIECE 巻3', 199806],
 ['ONE PIECE 巻4', 199808],
 ['ONE PIECE 巻5', 199810],
 ['ONE PIECE 巻6', 199812],
 ['ONE PIECE 巻7', 199903],
 ['ONE PIECE 巻8', 199905],
 ['ONE PIECE 巻9', 199907],
 ['ONE PIECE 巻10', 199910],
 ['ONE PIECE 巻11', 199912],
 ['ONE PIECE 巻12', 200002],
 ['ONE PIECE 巻13', 200005],
 ['ONE PIECE 巻14', 200007],
 ['ONE PIECE 巻15', 200009],
 ['ONE PIECE 巻16', 200012],
 ['ONE PIECE 巻17', 200102],
 ['ONE PIECE 巻18', 200104],
 ['ONE PIECE 巻19', 200107],
 ['ONE PIECE 巻20', 200109],
 ['ONE PIECE 巻21', 200112],
 ['ONE PIECE RED', 200201],
 ['ONE PIECE 巻22', 200202],
 ['ONE PIECE 巻23', 200204],
 ['ONE PIECE 巻24', 200207],
 ['ONE PIECE 巻25', 200209],
 ['ONE PIECE 巻26', 200212],
 ['ONE PIECE 巻27', 200302],
 ['ONE PIECE 巻28', 200305],
 ['ONE PIECE 巻29', 200307],
 ['ONE PIECE 巻30', 200310],
 ['ONE PIECE COLOR WALK 2', 200311],
 ['ONE PIECE 巻31', 200312],
 ['ONE PIECE 巻32', 200403],
 ['ONE PIECE 巻33', 200406],
 ['ONE PIECE 巻34', 2

In [None]:
onepiece

[['ONE PIECE FILM STRONG WORLD 下', 201012],
 ['ONE PIECE FILM STRONG WORLD 上', 201012],
 ['ONE PIECE THE MOVIE カラクリ城のメカ巨兵', 200611],
 ['ONE PIECE THE MOVIE エピソードオブチョッパー+冬に咲く、奇跡の桜', 200911],
 ['ONE PIECE 巻61', 201102],
 ['ONE PIECE 巻60', 201011],
 ['ONE PIECE 巻59', 201008],
 ['ONE PIECE 巻58', 201006],
 ['ONE PIECE 巻56', 200912],
 ['ONE PIECE 巻55', 200909],
 ['ONE PIECE 巻54', 200906],
 ['ONE PIECE 巻53', 200903],
 ['ONE PIECE 巻52', 200812],
 ['ONE PIECE 巻51', 200809],
 ['ONE PIECE 巻50', 200806],
 ['ONE PIECE 巻49', 200803],
 ['ONE PIECE 巻48', 200712],
 ['ONE PIECE 巻47', 200709],
 ['ONE PIECE 巻45', 200703],
 ['ONE PIECE 巻46', 200707],
 ['ONE PIECE 巻57', 201003],
 ['ONE PIECE 巻44', 200612],
 ['ONE PIECE 巻43', 200609],
 ['ONE PIECE 巻42', 200607],
 ['ONE PIECE 巻41', 200604],
 ['ONE PIECE 巻40', 200512],
 ['ONE PIECE 巻39', 200511],
 ['ONE PIECE 巻38', 200507],
 ['ONE PIECE 巻36', 200502],
 ['ONE PIECE 巻35', 200411],
 ['ONE PIECE 巻34', 200408],
 ['ONE PIECE 巻33', 200406],
 ['ONE PIECE 巻32', 200403]

###マージソート

In [None]:
def merge_sort(arr):
  #リストが一つの場合そのまま返す
    if len(arr) <= 1:
        return arr
    # 中央で分割
    mid = len(arr) // 2
    left_half = arr[:mid]
    right_half = arr[mid:]

    # 再帰的に分割してソート
    left_half = merge_sort(left_half)
    right_half = merge_sort(right_half)

    # 結合
    return merge(left_half, right_half)

def merge(left, right):
    result = []
    left_idx, right_idx = 0, 0

    while left_idx < len(left) and right_idx < len(right):
        if left[left_idx][1] < right[right_idx][1]:
            result.append(left[left_idx])
            left_idx += 1
        else:
            result.append(right[right_idx])
            right_idx += 1

    result.extend(left[left_idx:])
    result.extend(right[right_idx:])

    return result


In [None]:


# 時間計測開始
start = time.time()

# 新しいリストを作り，そこにソートしたものが入っていく
sorted_onepiece = merge_sort(onepiece)

# 時間計測終了
print("計算時間: ", time.time() - start)

sorted_onepiece

計算時間:  0.0006506443023681641


[['ONE PIECE 巻1', 199712],
 ['ONE PIECE 巻2', 199804],
 ['ONE PIECE 巻3', 199806],
 ['ONE PIECE 巻4', 199808],
 ['ONE PIECE 巻5', 199810],
 ['ONE PIECE 巻6', 199812],
 ['ONE PIECE 巻7', 199903],
 ['ONE PIECE 巻8', 199905],
 ['ONE PIECE 巻9', 199907],
 ['ONE PIECE 巻10', 199910],
 ['ONE PIECE 巻11', 199912],
 ['ONE PIECE 巻12', 200002],
 ['ONE PIECE 巻13', 200005],
 ['ONE PIECE 巻14', 200007],
 ['ONE PIECE 巻15', 200009],
 ['ONE PIECE 巻16', 200012],
 ['ONE PIECE 巻17', 200102],
 ['ONE PIECE 巻18', 200104],
 ['ONE PIECE 巻19', 200107],
 ['ONE PIECE 巻20', 200109],
 ['ONE PIECE 巻21', 200112],
 ['ONE PIECE RED', 200201],
 ['ONE PIECE 巻22', 200202],
 ['ONE PIECE 巻23', 200204],
 ['ONE PIECE 巻24', 200207],
 ['ONE PIECE 巻25', 200209],
 ['ONE PIECE 巻26', 200212],
 ['ONE PIECE 巻27', 200302],
 ['ONE PIECE 巻28', 200305],
 ['ONE PIECE 巻29', 200307],
 ['ONE PIECE 巻30', 200310],
 ['ONE PIECE COLOR WALK 2', 200311],
 ['ONE PIECE 巻31', 200312],
 ['ONE PIECE 巻32', 200403],
 ['ONE PIECE 巻33', 200406],
 ['ONE PIECE 巻34', 2