8-7. 遺伝的アルゴリズム（vcopt）でナップザック問題を解く（離散的GA編）

本記事の内容は2019年5月13日に更新されました。

やること
実行環境
import
問題設定
最適解
（必須）評価関数
（任意）すべてのパラメータ群を可視化する関数
GAで最適化

やること

ナップザック問題をGAで最適化してみます。

実行環境

WinPython3.6をおすすめしています。

WinPython - Browse /WinPython_3.6/3.6.7.0 at SourceForge.net

Portable Scientific Python 2/3 32/64bit Distribution for Windows

vcoptの使い方についてはチュートリアルをご参照ください。

vcoptの仕様については最新の仕様書をご参照ください。本記事執筆時とは仕様が異なる場合があります。

import

まずは、今回使うパッケージをインポートします。

import numpy as np
import numpy.random as nr
import matplotlib.pyplot as plt
from vcopt import vcopt

問題設定

ナップザック問題として、「決められた金額をできるだけ少ない枚数の紙幣・硬貨で支払う」というコイン問題を考えます。今回購入したいものはこちら。

INTEL インテル CPU Corei9-9900K INTEL300シリーズChipsetマザーボード対応 BX80684I99900K【BOX】

2019/3/21時点で65,858円です（高い）。四捨五入して65,860円としましょう。

これを10000円札、5000円札、1000円札、500円玉、100円玉、50円玉、10円玉の７種類を組み合わせて支払いますが、できるだけ少ない枚数にするという問題です。各紙幣は0～9枚まで取ることができます。

最適解

冷静に考えれば最適解はわかります。いつもレジでやっていることです。（私は現金派）

[10000, 5000, 1000, 500, 100, 50, 10]円 → [6, 1, 0, 1, 3, 1, 1]枚

（必須）評価関数

#ナップザック問題の評価関数
def money_score(para):
    
    money = para[0]*10000 + para[1]*5000 + para[2]*1000 + para[3]*500 + para[4]*100 + para[5]*50 + para[6]*10
    num = np.sum(para)
    
    #スコアの計算（直接returnする）
    return (abs(65860 - money) + 1) * num**2

moneyは合計金額、numは合計枚数です。moneyは65860に近づけ、かつ、numは少なくするために、このような評価関数にしました。この評価関数が小さくなる方向に最適化します。

（任意）すべてのパラメータ群を可視化する関数

poolを受け取って、積み上げ棒グラフを並べます。

#ナップザック問題のpoolの可視化
def money_show_pool(pool, **info):
    
    #GA中の諸情報はinfoという辞書に格納されて渡されます
    #これらを受け取って使用することができます
    gen = info['gen']
    best_index = info['best_index']
    best_score = info['best_score']
    mean_score = info['mean_score']
    mean_gap = info['mean_gap']
    time = info['time']
    
    #プロット（および保存）
    plt.figure(figsize=(6, 6))
    #poolを100個まで積み上げ棒グラフでプロット
    x = np.arange(len(pool[:100]))
    plt.bar(x, pool[:100, 0]*10000)
    plt.bar(x, pool[:100, 1]*5000, bottom=pool[:, 0]*10000)
    plt.bar(x, pool[:100, 2]*1000, bottom=pool[:, 0]*10000 + pool[:, 1]*5000)
    plt.bar(x, pool[:100, 3]*500,  bottom=pool[:, 0]*10000 + pool[:, 1]*5000 + pool[:, 2]*1000)
    plt.bar(x, pool[:100, 4]*100,  bottom=pool[:, 0]*10000 + pool[:, 1]*5000 + pool[:, 2]*1000 + pool[:, 3]*500)
    plt.bar(x, pool[:100, 5]*50,   bottom=pool[:, 0]*10000 + pool[:, 1]*5000 + pool[:, 2]*1000 + pool[:, 3]*500 + pool[:, 4]*100)
    plt.bar(x, pool[:100, 6]*10,   bottom=pool[:, 0]*10000 + pool[:, 1]*5000 + pool[:, 2]*1000 + pool[:, 3]*500 + pool[:, 4]*100 + pool[:, 5]*50)
    #タイトルをつけて表示
    plt.title('gen={}, best={} mean={} time={}'.format(gen, best_score, mean_score, time))
    plt.ylim([0, 80000])
    #plt.savefig('save/GA_{}.png'.format(gen_num))
    plt.show()
    print()

GAで最適化

離散的なGAはvcopt().dcGA()で実行します。

#パラメータ範囲
para_range = [[i for i in range(10)] for j in range(7)]

#GAで最適化
para, score = vcopt().dcGA(para_range,                      #para_range
                           money_score,                     #score_func
                           0.0,                             #aim
                           show_pool_func=money_show_pool,  #show_para_func=None
                           seed=None)                       #seed=None

#結果の表示
print(para)
print(score)

実行結果

[6 1 0 1 3 1 1]
169.0

青は10000円札、オレンジは5000円札、緑は1000円札、赤は500円玉…といった色付けになっています。合計金額が65860円付近に収束しているのがわかります。

結果、3010世代の進化により、各枚数が[6 1 0 1 3 1 1]であることと、最小スコア169が得られました。スコアは、

#スコアの計算
return (abs(65860 - money) + 1) * num**2

からも分かる通り、合計枚数13の二乗に由来しています。