Harmonics in Complexity
人物の顔画像を生成するAIから出力された無数の画像とそのメタデータから、3つのテーマを考案し、そこから構想された3つの仮想空間を可視化しました。人には理解の及ばないAIの世界と、その中に潜む人にも解釈可能な世界を取り上げることで、顔の認識における両者の [知覚|評価] の親和性を推し測ります。
Scene1: 顔画像生成器の紹介 512のランダムシードから生成された顔画像と、付随するテキスト情報を表示します。 連続的に表示される様々な結果情報から、このAIの基本的な性能を理解し、アマナイメージズのデータセットから継承した特徴を垣間見ることができます。
Scene2: 潜在ベクトルの近似する画像を積層して作られたイメージ 画像生成時に出力したマッピングネットワークを使ったコンポジッション画像を描画します。100,000枚の画像の中から、ランダムに選ばれた4枚の画像それぞれを、ネットワーク上の512の値から比較。それぞれ一番近い値を持った512枚の画像は上部の画面に表示され、徐々に四方の層に積み込まれていきます。側面では比較基準となった4枚の画像の輝度値をもとに、積層された画像群を切削。次元の異なるピクセル層が1つとなって浮かび上がります。AIが膨大な学習を経て構築した複雑な多次元空間を1つの視点から重ね合わせます。
Scene3: 3次元圧縮空間の探索 100,000枚の顔画像の特徴ベクトルから構成された空間にIsomapによる埋め込み処理を行うことで、Scene2で用いた512次元のマッピングネットワークを3次元に圧縮。全ての画像を人間の認知しやすい3次元空間上に展開します。四方からはサーチライトが放たれ、接触するとその顔画像が画面前方に写し出されます。意外にもAIの展開した画像の分布には、人にも知覚可能な領域が多分に含まれています。