紅華祭 2017を終えて

LinuxClubの1年のKoyamaです。

今後、このブログを通じてサークルの活動の様子を積極的に発信していきたいと思います。この記事では2017年度紅華祭を振り返ってみたいと思います。まず、部長から全体を通したコメントです。

全体を通じて

前日に完成している展示物がなくて焦ったものですがみなさんいいものを作ってきてくれて驚きました。普段コンソールに向かっているので見栄えのいいものと言われても困ったとは思いますが良い作品を展示できてよかったです。

個人制作

1,2年生を中心に個人作品を制作しました。作品名 [作者]という形式で見出しをつけています。

1. 空飛ぶ絨毯 [Koyama]

Webカメラで取得した映像とあらかじめ用意した動画をクロマキー合成するプログラムを作成し、展示しました。使用した言語はPythonでライブラリはOpenCVを使用しました。以下の記事を参考にしながらコードを書きました。

ソースコードは以下です。

#!/usr/bin/env python

import numpy as np
import cv2
import sys

argv = sys.argv

try:
    if argv[1] == "1":
        param = "cloud.mp4"
    elif argv[1] == "2":
        param = "coastline.mp4"
    elif argv[1] == "3":
        param = "campus.mp4"
except IndexError:
    param = "campus.mp4"

# Windows size Swttings
winSize = ( 1300, 700 )

# Sets color-range of mask
# [memo] (Blue, Green, Red)
lower = np.array([60/2, 50, 80])     # Min
upper = np.array([250/2, 255, 255])  # Max

# Camera Settings
videoStr = cv2.VideoCapture(1)

# Background Settings
backVdo = cv2.VideoCapture('videos/' + param)

while(True):
    # Get each frame
    ret, front = videoStr.read()
    ret, back  = backVdo.read()

    # Resize movies
    front = cv2.resize(front, winSize)
    back = cv2.resize(back, winSize)

    # Convert BGR to HSR
    hsvFront = cv2.cvtColor(front, cv2.COLOR_BGR2HSV)

    # Make mask by 'hsvFront'
    maskFront = cv2.inRange(hsvFront, lower, upper)

    # Apply Gaussian-blur
    # gMaskFront = cv2.GaussianBlur(maskFront, (5, 5), 0)

    # Revrse Mask area
    # rgMaskFront = cv2.bitwise_not(gMaskFront)
    rgMaskFront = cv2.bitwise_not(maskFront)

    # Attach mask
    streamFront = cv2.bitwise_and(front, front, mask=rgMaskFront)
    streamBack = cv2.bitwise_and(back, back, mask=maskFront)

    # Catinate each mask
    disp = cv2.bitwise_or(streamFront, streamBack, maskFront)

    # Display windows
    cv2.imshow('DEMO:disp',disp)
    # cv2.imshow('DEMO:front',front)
    # cv2.imshow('DEMO:back',back)

    # Delay 10ms and Check keydown 'q' for exit
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Release objects
videoStr.release()
backVdo.release()
cv2.destroyAllWindows()

途中でOpenCVのエラーで終了してしまうのでシェル芸で回避しました。パラメータを変えることで背景の動画を変更できる機能も実装してうまく連携させました。

while true
do
  for foo in {1..3}
  do
    python3 origin.py $foo
  done
done

実際に動かすと以下のようになります。

2. 移植版ドアセンサー [Koyama]

サークルの部室にドアが開くと音が鳴る謎のシステム(Raspi + スピーカ)を作りました。その移植版をArduino UNOとProcessingを使って作成しました。センサーは秋月電子で販売されているドア用センサーを使いました。

ケース入りリードスイッチ（磁石付セット）ＭＣ－１４ＡＧ: センサ一般秋月電子通商電子部品ネット通販

Arduinoには次の回路を実装しました。

次にArduinoへ以下のプログラムを書き込みます。このプログラムではdigital 7番ピンに接続されたセンサーの値を取得してシリアルに書き出す処理を行っています。delay(100)によって遅延処理を行っています。

#define SENSOR_PIN 7

void setup(){
  Serial.begin(9600);
}

void loop(){
  int val = digitalRead(SENSOR_PIN);
  Serial.write(val);
  delay(100);
}

Arduinoにプログラムが書き込めているかシリアルモニタを使って確認します。

次にProcessingを起動します。そして、以下のプログラムを入力します。

import processing.sound.*;
import processing.serial.*;

/* Viewer */
boolean status = false; // Now status
boolean before = true; // Before status
PImage closeImg, openImg;
SoundFile hi, bye;

/* Srial */
Serial port;
float val;

void settings(){
  size(1300, 700);
}

void setup(){
  /* Serial */
  frameRate(60);
  String arduinoPort = Serial.list()[0];
  port = new Serial(this, arduinoPort,9600);
  
  /* Image and Sounds */
  noStroke();
  setBack();
  closeImg = loadImage("proc_testVisualizer/door_close.png");
  openImg = loadImage("proc_testVisualizer/door_open.png");
  hi = new SoundFile(this, "proc_testVisualizer/door_hello.wav");
  bye = new SoundFile(this, "proc_testVisualizer/door_close.wav");
}

void setBack(){
  background(#cccccc);
}

void draw(){
  if(port.available() > 0){
    val = port.read();
    println("test: "+val);
    
    if( val == 1.0 ){
      status = true;
    }else{
      status = false;
    }
    
    if(status && !before){ // open
      before=true;
      setBack();
      image(closeImg, 200, 0);
      bye.play();      
    }else if(!status && before){ // close
      before=false;
      setBack();
      image(openImg, 200, 0);
      hi.play();
    }
    
  }
  
  stroke(120);
  fill(255);
}

プログラムの概要について説明します。

プログラム先頭のimport processing.sound.*;ではあらかじめインストールしたサウンドを再生するライブラリを読み込んでいます。
その後にあるbooleanやPImageやSoundfileではセンサーの状態、画像ファイル、音声ファイルを保持する変数を宣言しています。
setup()ではシリアル、画像、音声の初期化を行っています。
setBack()では背景を設定しています。
draw()ではセンサーの値に応じてドアが開いているか、閉じているかを判断しています。また、その状況に応じて画像や音声を切り替えています。

次に画像ファイルと音声ファイルを用意します。

画像はいらすとやから入手しました。

いろいろな状態のドアのイラスト | かわいいフリー素材集いらすとや

ダウンロードした画像ファイルのドアが揃うようにGIMPで調整しました。そして、ファイル名をdoor_close.pngとdoor_open.pngにリネームします。

音声は音声合成システムOpen JTalkを使用して作成しました。今回は一時的な使用だった為、Dockerを使いました。

yamamotofebc/open_jtalk - Docker Hub

まず、イメージを入手します。

docker pull yamamotofebc/open_jtalk

次にリファレンスに従って生成したい文字列を設定してコマンドを実行します。単純な読み上げにしか対応していないのでこんにちはをこんにちわとして設定しています。

echo "こんにちわ" | docker run -i --rm yamamotofebc/open_jtalk > door_hello.wav
echo "ばいばいきん" | docker run -i --rm yamamotofebc/open_jtalk > door_close.wav

これらの準備が終わったらProcessingのIDEに戻って実行ボタンを押下します。LinuxではIDEをroot権限で起動しないとシリアルデバイスにアクセスできないので注意が必要です。

うまく動作すればドアセンサーが離れたときに画面上にドアが開いている画像が表示され、「こんにちは」という音声が流れます。

3. 物体認識 [部長]

DarkNetを使った物体認識ソフトウェアを作りました。基本的な構造としてはDockerを使い、フロントエンド、バックエンド、静的ファイルの配信サーバーという形で構築し、AWS上で動作させていました。

※DarkNetとはC言語で書かれた機械学習ライブラリです。学習済みデータが公開されているので画像をぶん投げるだけで解析してくれる優れものです。

フロントエンド

使用ライブラリ

- React
- Recompose
- Material UI

フロントエンドではES6にReact, Recomposeを使いました。来場者にアクセスさせて写真をアップロード、解析した写真を表示する機能しか必要なかったのですが無駄にモダンな構成になっています。特筆することはないです。

バックエンド

使用ライブラリ

- PIL (画像処理)
- falcon (APIサーバー)

バックエンドはpythonで書きました。falconでルーティングしてDarkNetに投げるなどの役割を担っています。

PILはiphoneから投げられた画像に対して処理をしています。画像は主にEXIFと呼ばれる情報の格納部分があり、そこにOrientationという画像の向きを保持する情報があります。iphoneで撮影された画像はその部分が常にright-topという横向きの状態で保持されるらしく、PILを使って画像を縦向きに回転して保存する処理をしてます。

PILは

img = Image.open(filename)
exif = img._getexif()
orientation = exif.get(0x112, 1)
img.save(original_filename)

とかするとexifをスッととってこれて楽でよかったです。

静的ファイルの配信サーバー

nginxでDarkNetで書き出された画像を配信してるだけです。特筆事項なし。

反省など

色々ばたついてて作り始めるのが遅かったせいで大したものが作れなかったのが心残りです。それとDarkNetをDockerの上に載せていたせいでレスポンスがだいぶ悪くなってしまいました。workerも4つしか動かしておらずお世辞にも十分だったとは言えない感じです。来年はGTX TITANとか買って望みたいです。嘘です。

4. OpenCVのチュートリアル [homirun]

Webカメラで撮影された動画をリアルタイムでカスケード分類器を用い顔認識させてみました。顔を検出してその上に某氏の画像をオーバーレイしました。 PyConの日に作りました。

使用ライブラリ

OpenCV
numpy
pyplot

import cv2
import numpy
from matplotlib import pyplot

face_cascade = cv2.CascadeClassifier(
    "/usr/local/Cellar/opencv/3.3.0_3/share/OpenCV/haarcascades/haarcascade_frontalface_default.xml")

cap = cv2.VideoCapture(0)
coverImg = cv2.imread('faces.png', cv2.IMREAD_UNCHANGED)

while True:
    ret, img = cap.read()
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)
    #eyes = eyes_cascade.detectMultiScale(gray, 1.3, 5)
    for(x,y,w,h) in faces:
        #cv2.rectangle(img,(x,y),(x+w, y+h), (255, 0, 0), 2)
        #cv2.rectangle(img,(x,y),(x+w, y+h), (255, 0, 0), 2)
        if h >= 0 and w >= 0:
            coverResize = cv2.resize(coverImg, (h,w), interpolation = cv2.INTER_AREA)
            alpha = coverResize[:,:,3]
            alphaArray = numpy.ones((w,h,3))
            for i in range(len(alphaArray)):
                for j in range(len(alphaArray[0])):
                    alphaArray[i][j] = numpy.ones(3) * alpha[i][j]
            alphaArray = alphaArray / 255.0
            coverResize = coverResize.astype('float64')
            coverResize = coverResize[:,:,:3]
            img[y:(y+h), x:(x+w)] = img[y:(y+h), x:(x+w)] * (1 - alphaArray)
            img[y:(y+h), x:(x+w)] = img[y:(y+h), x:(x+w)] + coverResize * alphaArray
    cv2.imshow("img", img)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

5. 声でツイートできるプログラム [panakuma]

　音声認識で録音した音声をテキストに起こして、ツイッターにポストするプログラムです。言語はPythonで、音声認識はGoogle Cloud APIを使いました。

ソースコードは以下です。

全体の実行スクリプト

Google APIを叩くソース

ツイッターに投げるソース

ハマった(?)点

Google Cloud APIから吐かれるjsonファイルの取り扱いで1日ほどハマってました。(最終的にK氏に解決していただいた)

当初の予定では、京都大学河原研究室が開発したJuliusという音声認識システムを使う予定でしたが、認識精度が低かったため、Google APIに投げることにしました。

6. CPU use rate [lapua]

CPU使用率をリアルタイムで表示するGUIアプリ。16コアまで対応。使用ライブラリはQt5.0.0 初めてのクラス設計に苦労しました。

7. 数当てゲーム [ayu]

コンソールから入力された数字に対して当ってるだの当ってないだの評価して返す簡単なゲーム．Javaで書きました．GUI化させていきたい．

8. 目覚まし [uwdd]

今回初めて~~まともな~~プログラミング作品を作りました。朝起きれなくて遅刻が増えてきたので今回は目覚まし時計を作りました。まだいくつか不具合があったりデザインが簡素すぎたりするので暇があれば直していきたい。

毎年恒例?のLC OB会

LinuxClubの歴史は長いらしく、古くはLinux研究所という名前だったそうです。

学祭で社会人OBが集まるということが恒例になっているようです。OBと現役生の交流の場になっていました。

2日目から始まったライブ中継

2日目から先輩のカメラでライブ中継を行いました。

大学からの取材

大学の広報から取材を受けました。何かしらの映像で公開されるかと思われます。おそらく、紹介動画かと思われます。

学園祭（紅華祭・かまた祭）[2017年] | 学生生活 | 東京工科大学

来年に向けて

展示品の数が少なかったので来年はもっと数を増やすべきだと思いました。来場された方が見て分かるよう説明を加えるなど「何を、どのように実現しているか」を明確にする必要があると感じました。

また、来場された方から「今年は冊子を作ってないんですか？」と聞かれることがあったので来年は部誌のような冊子を作成したいと思います。

来場して頂きありがとうございました。ぜひ来年もお越しください!!