interview hero

R&Dエンジニア

ハダノウィチ アレクセイ Khadanovich Aliaksei

ベラルーシ出身。東京都市大学卒業後、同大学院にてEnd-to-End 音声認識システムの研究・開発を行う。同時にEYS-STYLEInspiartプロジェクトに参画し、機械学習によるノイズ除去に関する開発を担当。

Convolutional LSTMなどのニューラルネットワークアーキテクチャの研究を専門とする。

異なる文化・価値観に飛び込むべく、
ベラルーシから日本へ。
“大学院”と“ビジネス”の両輪で
機械学習研究を加速させる。

出身はベラルーシ、大学進学を機に日本へと留学したハダノウィチ アレクセイ(Khadanovich Aliaksei)氏。大学では機械学習を専攻し、大学院への進学を決めた。だが一方で「勉強するだけでは足りません」とEYS-STYLE(以下、EYS)のInspiart事業に参加している。「大学でおこなう研究と企業における仕事では、やり方も目的もすべてが異なるので、両方大切です」と語るアレクセイ氏の、機械学習への取り組みとは―――。

Khadanovich Aliaksei

価値観が異なる環境に、敢えて身を置く

高校でITを専門的に学んだアレクセイ氏。故郷であるベラルーシで大学に進学する道もあったが、彼が選んだのは日本への留学だった。「ベラルーシにもプログラミングやエンジニアリングを学べるいい大学はありますが、勉強だけでなくさまざまな文化に触れる経験が自分の成長につながると考え、留学することに決めました」と話す。価値観も文化もまったく異なる環境に身を置くことが、自身の視野・考えを広げることにつながる。
そして、留学先に選んだのは日本。神社仏閣など日本の伝統的な建築に興味があったというが、それまで日本語を学んでいたわけではない。留学が決まってから、家庭教師をつけて日本語の勉強を開始、来日後1年半、日本語学校に通ったのち、大学に入学。3年次にはAIを専攻することを決めた。「高校時代の友人にはIT関係の仕事をしている人が多く、Webテクノロジーやサーバサイド、バックエンドなどの開発をしていますが、私はそういった領域に興味を持てずにいました。そのなかで、心から面白いと思えたのがAIでした」周囲に流されず、自分の興味を見つけること。それが大きな成長への礎となるのだろう。

Khadanovich Aliaksei

課題は難しいほどおもしろい

AIのなかでも、アレクセイ氏はディープラーニングやEnd-to-Endアーキテクチャによる音声認識を主に研究している。話し声から文字列への変換などをおこなうこのジャンルは、最近ではスマートスピーカーにも搭載されるなど、実用化が進んでいる分野だ。技術が大きな進化を遂げる一方で、課題も残る。現在の技術では2人で話す声をそれぞれ認識することは難しくないが、複数人で同時に話す声はまったく認識できないという。「会議などでは中央にマイクを置いて、いろいろな人が話すのが普通です。人間はそういった状況でも聞き分けることができるのに、機械はできません。ものすごく興味深い課題だと思います」とアレクセイ氏は話す。解決すべき課題が大きいほど、興味も大きくなる……難題を見つけたことを本当に楽しんでいるようだ。

Khadanovich Aliaksei

「この人と一緒に仕事をしたい」と思う出会い

そんなアレクセイ氏がインターンとして働いていた企業で出会ったのが、現在はInspiartで機械学習開発を進める金 氏だ。「金さんはすごく優しくて、賢い方で、一緒に仕事をしていると自分の成長にもつながります。金さんが博士を目指すと聞いて、私も将来博士号取得を目指したいと考えるようになりました」目標であり、憧れである金 氏に誘われたことから、Inspiartに参加することとなる。「音楽とAIという、私が好きな2つの分野を組み合わせたプロジェクトは純粋に面白そうだと感じました。あとは働き方がフレキシブルなのもいいですね」アレクセイ氏は留学生ビザの都合上、勤務時間は週28時間までという制限がある。この制限のなかで稼働時間を調整しながら、プロジェクトに参加している。大学の春期休暇中は勤務時間が拡大されるため、8時間×5日間働くこともあるが、大学院の授業がはじまれば、また状況が変わる。変動的な状況を当たり前に受け入れてくれる環境は働きやすく、そして働きやすいからこそより実力を発揮しやすい環境へとつながっていく。

Khadanovich Aliaksei

“研究”と“ビジネス”という両輪

もうひとつ、Inspiartにおける開発内容を大学院の論文に展開することについて許可が出ているという点もEYSで働くメリットだ。もちろん機密事項はあるが、大学院の教授やInspiartのリーダーと調整しながら進める予定だという。「時間は限られていますから。大学院と仕事で同じ内容に取り組めば、研究もプロジェクトもスムーズに進むでしょう」と話す。説得力のある話だが、自社での開発内容をほかに展開されることに拒否感を抱く企業も少なくないのだろう。
またアレクセイ氏は、大学院での研究と、企業での仕事を両立することにも意義があると話す。「大学院に通うだけでもいろいろな人から学ぶことは多くありますが、ビジネスの現場では身につくことがまったく異なります。両方の立場から世界を見ることは重要ですね」大学院における基礎研究の重要性は言うまでもないが、なにかしらのアウトプットが求められるビジネスの世界では、見えるものが違う。2つの場を行き来しながら研究を進める経験はアレクセイ氏の大きな強みとなっていく。

Khadanovich Aliaksei

話し声と音楽、共通点と相違点

Inspiartでは、アレクセイ氏も金 氏とともにAI開発の第1フェーズであるノイズキャンセリングを担当している。「話し声も音楽もデジタル信号という点は共通しており、これまで音声認識で使っていて音楽に展開できるモデルもいくつかあります」共通点がある一方で、異なる点もある。音声認識では出力が文字列になるが、音楽では出力もデジタル信号だ。エラーレートを計算する際に、文字列では表記のゆれなどが発生し、どこまでを正解とするのか線引きが難しかった。しかし「すべてデジタル信号で出力される音楽では、エラーレートを正確に計算できます。個人的にはこちらの方がやりやすいですね」
ほかにも違いはある。「話し声と環境音は違いが大きいので、ノイズを消すのはそれほど難しくありませんが、音楽と環境音は違いが微妙で、“ノイズだけを消す“ことのハードルは高いです。あとは、音楽だとデータ量が大きいので、計算量も大きくなります」一般的に音声認識(話し声)で16KHzのデータを利用するのに対し、音楽で利用するのは44.1KHz。その分、データ量も大きくなる。確かに話し声であれば”音質“は問題にならないが、音楽ではデータを圧縮すると音質も劣化してしまう。大容量ファイルをいかに効率的に処理するかまで踏まえた開発が必要だ。こういったハードルや制限の存在が、さらにアレクセイ氏のやりがいを掻き立てているようだ。

Khadanovich Aliaksei

夢の世界を、自分の手で開発する

今後のテーマを聞いたところ、「Convolutional LSTM」という答えが戻ってきた。これはConvolutional Neural Network(畳み込みニューラルネットワーク)と、LSTM(Long Short-Term Memory)を組み合わせ、AIの成長を目指す手法だ。Convolutional Neural Networkは画像に対して多く用いられてきたモデルだが、音楽もスペクトログラムを生成することで、このモデルを適用可能になる。これにさらに音声や翻訳などで用いられてきたLSTMを組み合わせることで、より高い成果をあげられるのではないか、考えているという。
ノイズキャンセリングの次は、ミキシングの開発が待っている。「ミキシングはもっと難しくなります。けれど、これが実現すれば、プロフェッショナルではない人も自分の楽曲を作れるようになり、音楽の世界が広がります。世の中に知られていない人ももっと簡単に曲を出せるようになる、そうなったら楽しいですよね」胸躍る世界を自らが切り拓く、エンジニアとして理想の仕事ではないだろうか。

blogArea

アレクセイ / 執筆記事

leaders

“Inspiart”プロジェクトを推進する
プロジェクトメンバーのご紹介

cso
CSO

九頭龍 雄一郎

国内大手楽器メーカーからシリコンバレーの音楽系ベンチャーへ、さらに帰国後介護関連デバイスを開発するベンチャーに参加。

2018年EYS-STYLEの取締役CSO / Inspiart事業本部長就任。同時期に株式会社クレイテックを起業し、製品企画からハ ードウェア/ソフトウェア開発、生産まで全プロセスを手がけてきた経験を強みに、新規事業開発などのコンサルティングを おこなう。

インタビューを見る
大塚 健司
CTO

大塚 健司

京都大学理学部卒、SIerにおけるシステム開発を経て2013年EYS-STYLE入社。

その後、株式会社ぐるなびなどを経て、2016年にEYS-STYLEのCTOに就任。Web開発、Android Phone/Wearの開発、機械学習など幅広い分野の開発経験を持つ。現在は、EYS STYLEのInspiartプロジェクトにおいてブロックチェーン開発及びEYS-STYLEモンゴルオフィスのマネジメント業務を担当する。

インタビューを見る
金 賢
R&D エンジニア

金 賢

早稲田大学基幹理工学部応用数理学科卒業、シンガポール国立大学大学院理学研究科数学専攻修了(修士)。

卒業後シンガポールで自動運転自動車の時系列データ解析、センサーフュージョン、センサー外れ値検知、物体検出などのモジュールを開発。日本に戻り、音声認識、異常音検知などのプロジェクトに従事。現在は楽曲の自動作成、音源調整技術を開発中。

インタビューを見る
張 森
R&D エンジニア

張 森

千葉大学の飛び入学制度を利用し、17歳で入学。
3年で大学を卒業し、総合研究大学院大学で素粒子物理学の博士号を取得。

岡山光科学研究所に勤務し、研究を進める傍らITに興味を持つ。SIer、機械学習関連のベンチャー企業を経て、現在はEYS-STYLE Inspiartプロジェクトにて、機械学習による楽曲ミキシングなどの研究開発を担当する。

インタビューを見る
ハダノウィチ アレクセイ
R&D エンジニア

ハダノウィチ アレクセイ

ベラルーシ出身。東京都市大学卒業後、同大学院にてEnd-to-End音声認識システムの研究・開発を行う。

同時にEYS-STYLE Inspiartプロジェクトに参画し、機械学習によるノイズ除去に関する開発を担当。

Convolutional LSTMなどのニューラルネットワークアーキテクチャの研究を専門とする。

インタビューを見る
野田 誠人
CTO

野田 誠人

大阪大学理学部数学科中退。SES企業に入社し、C#を中心としたシステム開発を手がける。その後、かつてバンドに参加していた縁からEYS-STYLEに転職し、ほぼ唯一のエンジニアとして基幹システムを構築。結婚を機に京都へ生活圏を移し、フリーランスを経て塾・教育業界向けシステムを受託開発する企業に転職。講座や出欠管理から動画配信、LINE連携までさまざまなサービスを開発した。2019年4月、Inspiart事業に参加すべく再びEYSに入社。

インタビューを見る