1秒間に約20億枚の画像を分類するフォトニクスチップの試作品が実現

ペンシルバニア大学の研究者グループによって、1枚あたり0.57ナノ秒以下で画像を認識できるフォトニックチップを設計した事が報告された。テストチップはわずか9.3mm角の大きさとなり、スケーラブルな集積フォトニックデバイスに完全に実装された最初のディープニューラルネットワークと言われている。

Source

Nature : An on-chip photonic deep neural network for image classification

このフォトニクスチップが実現した画像認識の速さは驚異的な物だ。

0.57ナノ秒という認識時間は、連続的に動作させた場合、1秒間に17億5000万枚の画像を分類できることを意味する。

光チップやフォトニクス技術は、従来のマイクロエレクトロニクスのようなワイヤー配線による抵抗や熱の問題がないため、近年盛んに研究が進められている。特にフォトニックチップの開発事例は、高速ネットワークなどのソリューションに集中しているという。

ペンシルバニア大学では、フォトニック技術とニューラルネットワークの両方を駆使して、今回の素晴らしい画像処理を実現した。従来、ニューラルネットの処理にはCPUやGPUなどのシリコンチップが使われており、NVIDIAなどは、画像（顔、物体など）や音、映像を認識するAIシステムを動かすプロセッサの速度を誇っている。しかし、今回の研究は光チップを使用してニューロンをシミュレートした最初の事例となり、この技術が非常に高速で低消費電力であることを雄弁に物語っている。

研究論文では、アルファベットを使って光ニューラルネットを訓練し、手書き文字の認識率も約90％を達成したことが明らかにされている。ただし、テキストは6×5ピクセルのグリッドに限定されていたことから、ニューラルネットの学習と正確な認識をよりシンプルなものにしている。これによって驚異的な画像認識速度を実現したようだ。

ただ、研究グループはスケーラビリティ（拡張性）の可能性を主張しており、今後の開発によって、このフォトニックチップはコンピュータビジョン、3D物体分類、医療診断など、より複雑な処理に役立つようになると考え考えている。速度に関しては、科学者たちは、現代の最高の製造プロセスを用いれば、現在のチップの認識速度を1枚あたり0.1ナノ秒まで上げることができると述べている。これは、他の条件が同じであれば、1秒間に100億枚の画像を分類できる可能性があることを意味する。

前述したように、ビデオや3Dオブジェクトの分類にはニューラルネットが使われているが、ペンシルバニア大学の研究チームは、1cm角以下のフォトニックチップをこれらの入力で認識タスク用に訓練するつもりである。さらに、より複雑で高解像度の画像を分類するために、より多くのピクセルとニューロンを持つフォトニックチップに取り組むことも確認されている。