2015年にサンディエゴを拠点に設立され、エッジAIコンピューティング・ソリューションに注力しているKneronは、軽量エッジ・コンピューティングとGPTレベルのアプリケーション・ソリューションを実現する新しいAIチップ「KL730」を年末までにリリースすることを発表した。
Kneronは、Transformer AI言語フレームワークをサポートする初のエッジAIチップであるKL530を2021年に発売しており、今回発表されたKL730によって、車両グレードのNPUと画像プロセッサを組み合わせて最大0.35-4 TOPSの演算性能を提供し、軽量GPT大規模自然言語モデリングのサポートを実現したとしている。
KL730は、エッジサーバー、スマートホーム、自動車運転支援システムなどのアプリケーションへの展開を想定しており、従来のKneronチップの3~4倍、市場の類似製品の1.5~2倍の高性能を誇るとのことだ。
Kneron社のCEOであるAlbert Liu氏は、NPUチップはAIのために特別に設計されたものであり、もともとグラフィックス処理のために作られたものをAIのために働かせるものではないとThe Vergeに語っている。「私たちのようなかなりパワフルで軽量なチップがあれば、GPTのような強力なTransformerモデルを多くの種類のデバイスに導入することができるのです」と、Liu氏は語る。
KL730は、リコンフィギュラブルNPUアーキテクチャの第3世代KDPシリーズで構築され、Arm Cortex-A55 CPU設計を採用し、内蔵DSPにより音声処理を高速化し、TSMCの12nmプロセスで製造され、Cafee および Tensorflow をサポートする。Tensorflowlite、Pytorch、Keras、ONNX コンピューティング フレームワーク、および CNN、Transformer、RNN Hybrid などのインテリジェント・セキュリティ、自律走行、ビデオ会議、産業用カメラ、業務用ロボットなどのコンピューティング・シーンに応用できる。
KL730は、配備されたアプリケーションが端末上でGPTモデルを部分的または完全にオフラインモードで実行することを可能にし、NexStarのプライベートでセキュアなエッジAIネットワークであるKNEOにより、AIはエッジデバイス上でより安全に動作し、プライバシーとセキュリティ保護を実現することができる。5つの操作モデルは、企業サーバーソリューション、インテリジェント運転車両、またはAI搭載医療機器に適しており、セキュリティを向上させながら機器間のコラボレーションを改善する。
「AIを動かすには、これまでとはまったく異なるアーキテクチャを持つAI専用チップが必要です。グラフィックス専用GPUチップのような隣接技術の単純な再利用では、この仕事はできません。KL730はエッジAIのゲームチェンジャーです。KL730は、エッジAIのゲームチェンジャーです。前例のない効率性とトランスフォーマー・ニューラル・ネットワークのサポートにより、私たちは、データ・プライバシーとセキュリティに妥協することなく、AIの可能性を最大限に引き出すために、あらゆる業界のユーザーに力を与えています」と、Liu氏は語っている。
Source
コメントを残す