United Statesからアクセスのようです。言語設定をEnglishに切り替えますか?
Switch to English site
Skip to main content

GoogleのAIを活用した新方式 シンセサイザ!

Main16_f4ea28faf0234d826cfdf749a93c5c333824163c.jpg

ラズパイと機械学習を利用した異なる音の間から新しいユニークな音を創る楽器

NSynth (ニューラルシンセサイザー) とは、Googleの研究プロジェクト「Magenta」で作成された「AI」音声合成アルゴリズムだ。ディープニューラルネットワークを使用して音の特性を学習することで新しい音を作成する。ただ音をミキシングするだけでなく、元の音の音質を使って全く新しい音(新しい楽器)を創り出すことができる。

このNSynthアルゴリズムを使用して作成された電子楽器のプロトタイプが「NSynth Super」だ。このNSynth Superは誰でも自由に、そしてはんだ付けの経験があれば簡単に作成することができる。というのも、ソフトウェア類はすべて公開されており、そのソフトにはサンプル音源も付属しているため、手元に楽器の音源が用意できなくても、サンプル音源を使用して新しい楽器を創り出すことができる。また、そのまま製造業者に委託できるようプリント基板やエンクロージャーのデータも公開されている。

動作原理

NSynth_blog_figs_WaveNetAE_diagram_fa61f418a0b8083502526a0637253859b86a9b69.jpg

WaveNetオートエンコーダーのダイアグラム。出典: magenta.tensorflow.org.

前述した通り、NSynthはディープニューラルネットワークを用いて音を生成する。このウェブサイトでは以下のようにプロセスを記述している。

“オートエンコーダーを使用し、各入力から時間的特徴を定義する16個の要素を抽出する。これらの特徴量は線形補間され、新しい埋め込み(各サウンドの数学的表現)が作成される。これらの新しい埋め込みは、両方の入力の音響特性を持つ新しい音にデコードされる。”

詳細はこちらを参照。 NSynth: Neural Audio Synthesis page

ons_main_overview_57cc5c3ac8d81b643e0031423e78da68163b999f.jpg

Nsynth Superの概要。出典: https://github.com/googlecreativelab/


NSynth Superは生成されたオーディオを取り込み、以下のような物理的なインターフェースや楽器に提供する。

    • MIDI入力端子 ピアノのキーボードやシーケンサー、PCなど
    • 4つのロータリーエンコーダー 機器の四隅に対応する楽器を割り当てる
    • OLEDディスプレイ 楽器の状態や制御情報の表示用
    • 優秀なコントローラー類:
      • Position(ポジション) 波の初期位置の設定
      • Attack(アタック) 音の立ち上がりにかかる時間の設定
      • Decay(ディケイ) Attackの音のレベルから減衰する時間の設定
      • Sustain(サスティン) 持続中(鍵盤を押している間)の音のレベルの設定
      • Release(リリース) Sustainの音のレベルが減衰する時間の設定
      • Volume(ボリューム) 出力する音量の設定
    • タッチインターフェース 音の位置を確認する用

操作情報はあらかじめ搭載されたコードでマイコン制御されており、すぐにそのまま演奏使用できる。

部品表

こちらでは主に使用する部品を紹介している。

    • Alps RK09Kシリーズ ポテンションメーター 6個 (729-3603)
    • Bourns PEC11R-4315F-N0012 ロータリーエンコーダー 4個
    • Microchip AT42QT2120-XU 静電容量式タッチセンサ 2個 (899-6707)
    • STMicroelectronics STM32F030K6T6, 32ビット ARM Cortex コア
      マイコン 1個 (829-4644)
    • TI PCM5122PW, オーディオD/Aコンバータ 1個 (814-3732)
    • Adafruit 1.3インチ OLEDディスプレイ 1台

 

完全な部品表や、パーツの詳しい取り付け方法などはGitHubのリポジトリを参考にしてほしい。

こちらのリポジトリにはプリント基板のガーバーデータも載っている。

 

組み立て

Bare_65a57d09c3b48daf111c7b8d49c81e9a92fa871a.jpg

部品の大半は表面実装でリードピッチは0.5mmほどだが、慎重にすれば手作業でも行うことができる。しかし、絶対に必要というわけではないが、顕微鏡やホットエアステーションがあると良いだろう。そして、言うまでもなくフラックスとはんだもたくさん必要だ。

Legend_a00b286d135b88c1bd45e7a1a5f3d6a3c78dbad3.jpg

プリント基板に指定部品の取り付け表が印刷されている。

Resistors_fa0346fd3f7d41e8c674fdc8ebee5fc175fd162a.jpg

一般的にサイズの小さい部品から取り付けるのが理にかなっているため、まずは抵抗を取り付けていく。

Capacitors_88b131cb77aa1fad757c7e5d91469c5645b7634a.jpg

次にコンデンサ。

ICs_bb5cb7d4ab4f0c0673d543c3f669c8919b2f710a.jpg

その後、ICチップへ。

Microscope_93d9a0b097c2f438fefd7a196b0da377b58a0e31.jpg

ICチップのはんだ付けがうまくいかない場合、顕微鏡がとても役に立つだろう。

HotAir_fe8505b8ce353dbc690ac85a8e89816011774dd6.jpg

もしも、はんだを付けすぎてICチップ等の足が短絡してしまうような場合、ホットエアステーション (124-4133) を使用してはんだを熱し溶かして取り除こう。

あなたが一度もホットエアステーションを使用したことがない場合、Karl Woodwardのブログ記事 Choosing your next soldering tool を見ることをおすすめする。

Display_ffaa2546463d47bd0fbf935daeaf381cfe06abb3.jpg

ディスプレイはプリント基板内の切り欠きの下で、上部の両方の基板を通すピンとディスプレイボード下部の二つの突起をはんだで固定する。

Pots2_feaed244aa7d907262e5eac04781f0d8cdb06a64.jpg

その後、ポテンションメーターを取り付ける。

Encoder_59a09cd554352c612897eeab75fc98ef90302693.jpg

次に、四隅にロータリーエンコーダーを取り付ける。

MostlyAssembled_104f23e3a33ec70183ec74db82826a6b4685bed4.jpg

上の写真はほとんどの部品が取り付けられた基板で、後の作業はいくつかのコネクタを取り付けるだけだ。

Kapton_9d1f5d6ffd7de215d639bae0f77fbc4157cf4c5a.jpg

スルーホールの部分のピンとラズパイのコネクタの金属ハウジングの間に隙間があまりないため、Kaptonの絶縁テープを貼った。

PiFitted_8462ac93d2436d8829b44430f91670c2919b46e6.jpg

ラズパイを上に載せた写真だと、絶縁したところが少しよく確認できるだろう。

次に、赤いアクリル板でケースを作成し、SDカードにOSを書き込む。最初の起動では、キーボードとモニターを接続し、マイコンを設定する手順に従う。これはかなり簡単で時間はあまりかからなかった。

詳しい手順独自のNSynth Superを構築したい場合はGitHubのリポジトリを参照してほしい。

動作確認

インターネットからMIDIファイルをダウンロードし、 "aplaymidi"コマンドを使って、LinuxラップトップとUSB / MIDI端子を接続してテストした。確かにNSynth Superは起動したので、各コーナーに楽器を割り当て、機械学習で音を補間し、これまで知られていなかったフルートとマリンバを合わせた楽器「フラリンバ」を作成した。

Andrew Back

Open source (hardware and software!) advocate, Treasurer and Director of the Free and Open Source Silicon Foundation, organiser of Wuthering Bytes technology festival and founder of the Open Source Hardware User Group.
DesignSpark Electrical Logolinkedin