banner
ホームページ / ブログ / WDMとコヒーレント線形光学を組み合わせたプログラム可能なフォトニックニューラルネットワーク
ブログ

WDMとコヒーレント線形光学を組み合わせたプログラム可能なフォトニックニューラルネットワーク

Oct 09, 2023Oct 09, 2023

Scientific Reports volume 12、記事番号: 5605 (2022) この記事を引用

4379 アクセス

16 件の引用

1 オルトメトリック

メトリクスの詳細

ニューロモーフィック フォトニクスはこれまで、ドット積またはベクトルと行列の乗算を可能にするコヒーレント デザインまたは波長分割多重 (WDM) デザインのみに依存しており、これにより非常に多様なアーキテクチャが誕生しました。 ここでは、さらに一歩進んで、計算目的を果たすのではなく、ファンインおよび/または重み付けステージにわたる並列化機能でレイアウトを強化するために WDM を採用し、コヒーレント光学系と WDM を組み合わせたニューロン アーキテクチャを初めて提示します。多機能でプログラム可能なニューラル ネットワーク プラットフォーム。 当社の再構成可能なプラットフォームは、同じフォトニック ハードウェア上で 4 つの異なる動作モードに対応し、マルチレイヤー、畳み込み、完全接続、省電力レイヤーをサポートします。 クロストーク、チャネル間隔、重要な光学要素のスペクトル依存性を考慮して、4 つの動作モードすべてで良好なパフォーマンスが数学的に検証され、MAC 相対誤差 \(< 2\%\) で信頼性の高い動作が得られると結論付けています。

人工知能 (AI) と深層学習 (DL) の爆発的な成長と、フォトニック統合の成熟により、計算タスクで光学を使用する新たな機会が生まれました 1、2、3、4、5。 ニューラル ネットワーク (NN) ハードウェアでフォトンと関連する光学技術を使用すると、それぞれの NN 電子プラットフォームと比較して 1 秒あたりの積和演算 (MAC) 演算が大幅に向上すると予測されており、計算エネルギーと面積効率は以下に達すると推定されています。 < fJ/MAC および > TMAC/s/mm\(^{2}\) それぞれ 6,7。 この NN ハードウェア パラダイム シフトを実現するための経路は、チップ スケールで提供できる小型かつ低電力の重み付け機能とともに、統合されたフォトニクス テクノロジによってサポートされる高いライン レートを活用することを目的としています。 これまでのところ、重み付けの目的で利用されるフォトニックデバイスの大部分は、熱光学(T/O)移相器9、10や相変化材料(PCM)ベースの不揮発性メモリ構造4、8など、ゆっくりと再構成可能な要素に重点を置いています。これは、現在、推論アプリケーションがニューロモーフィック フォトニクスの領域内の主なターゲットとして考えられていることを意味します 3。

実際、推論エンジンには、かなり静的なニューロン アーキテクチャと、特定の AI タスクを最適に実行するために通常定義される層接続グラフが必要です。 たとえば、オブジェクト追跡や画像分類は通常、多数の畳み込み層とそれに続く 1 つ以上の完全接続 (FC) 層を介して実行されますが、オートエンコーダには FC 層のカスケード ステージが必要です11、12。 畳み込み層と FC 層は、ほぼすべての推論プラットフォームで重要なアーキテクチャ要素を構成しますが、層や層ごとのニューロンの数や接続グラフなど、多数のパラメータのセットは、対象となる DL アーキテクチャとアプリケーションに応じて大きく異なる可能性があります。 電子実装では、特定の推論タスク用にカスタマイズされた特定用途向け集積回路 (ASIC) が使用される場合がありますが、複数のアプリケーションで同じハードウェアを利用するために再プログラム可能性と再構成可能性が必要な場合には、GPU、TPU、さらには FPGA の使用が避けられなくなります。

再構成機能をフォトニック (P)-NN 実装に移行するには、同じニューラル ハードウェア上でさまざまな機能レイアウトを柔軟にサポートできるプラットフォームが必要です。 フォトニクスにおけるプログラマビリティはここ数年で大幅に進歩しており 14、15、16 、プログラマブルなフォトニック集積回路 (PIC) は、コスト効率が高く、柔軟で多機能のフォトニック プラットフォームのコンセプトに厳密に従うことができるフォトニック プラットフォームのリリースに向けて重要な利点を提供することが示されています。電子FPGA17. この取り組みでは、適切なアーキテクチャ方式内でゆっくりと再構成可能な \(2 \times 2\) マッハツェンダー干渉計 (MZI) スイッチを使用するだけで、大規模な回路接続と機能のオプションが得られることも強調されています 14,15 。 ただし、NN アーキテクチャの特異性は、プログラマブル フォトニック実装によって現在まだ提供されていない代替機能に沿って進める必要があります。 重み値の再構成は実際に最先端のフォトニック重み付け技術によって提供できます 4,8,9,10 が、プログラム可能な活性化関数への視点の変化も現れ始めています 16,18,19 が、これまでに実証されているニューロモーフィック フォトニック アーキテクチャ線形ニューロン ステージの再構成メカニズムはサポートされていません。 PNN はこれまで、線形ニューラル層を実現するための 2 つの主要なアーキテクチャ カテゴリに沿って進歩してきました。そこでは、波長分割多重 (WDM) プラットフォームとコヒーレント プラットフォームが離散的かつ並列のロードマップに従っているように見えます。 (i) インコヒーレントまたは WDM ベースのレイアウト。離散的な波長は、同じニューロン内の各軸索に使用されます 3、4、20、および (ii) コヒーレント干渉計スキームでは、単一の波長がニューロン全体にわたって利用され、加重和演算のためにコヒーレント電場間の干渉を利用します 9、10。

ここでは、4 つの異なる線形ニューラル層動作モードでプログラマブル PNN (PPNN) をサポートするために、WDM とコヒーレント フォトニクスを効率的に組み合わせることができる新しいアーキテクチャを紹介します。 最近提案したデュアル IQ コヒーレント線形ニューロン アーキテクチャ 21 から始まり、軸索あたりの画期的な計算速度を備えた PIC としても最近実証されています 22,23。我々は、複数の波長チャネルとそれぞれの WDM 多重分離を採用することで単一ニューロン アーキテクチャを拡張します。 (DE/MUX) 構造は、各軸索ごとに複数および単一要素のファンイン (入力) および重み付けステージを作成することを目的としています。 その後、ファンイン ステージと重み付けステージの間の接続を柔軟に定義できる \(2 \times 2\) MZI スイッチを通じてプログラマビリティが強化され、このようにしてソフトウェア定義のニューラル レイヤー トポロジが可能になります。 私たちは、このプログラム可能なニューロモーフィック アーキテクチャの数学的枠組みを定式化し、同じ干渉計配置内での複数の波長の使用に起因する予想されるパフォーマンス障害の詳細な研究を進めます。 私たちは、それぞれファンイン段階と重み付け段階で変調器と移相器の波長依存の動作に対抗するための単純なメカニズムを結論付け、プログラム可能なレイアウトが、4 つの異なるモードのいずれかで、使用される光チャネルの数に関係なく同等に良好に機能することを示しています。チャネル間クロストークが \(-\,20 \, \mathrm {dB} 未満の標準値に保たれている限り、サポートされているすべてのニューロンは常に \(2\%\) 未満の相対誤差を示します。 \)。

私たちの最近の研究 21 では、ドット積機能を提供するコヒーレント線形ニューロンが IQ 変調器ブロックでどのように構築され、バイアス信号 \( \Sigma w_i x_i + b\)、ニューロンを全光非線形活性化関数 \(f_\mathrm {NL}(\cdot )\) と互換性のあるものにし、情報を損なうことなく、電場または光パワーのいずれかに合わせて調整します。損失。 波長領域を活用せずに、図 1 に示すように、複数のチャネルに対応し、並列化を実現するために独自のニューロン アーキテクチャを進化させました。

(a) M 個のレーザー ダイオード (LD)、MUX、バイアス ブランチ (\(W_\mathrm {b}\)) が続く 3dB X スプリッター、および 1 対 N を含む再構成可能な OLAU を示す PPNN の概略図スプリッティング ステージ、入力 (\(X_n\)) およびウェイト (\(W_n\)) 変調器バンク、および N 対 1 コンバイナー ステージ、その出力は 3dB X カプラー内のバイアス信号と干渉します。 DEMUX に送信されます。 (b) 1 対 N の分割と (d) その \(\pi\) 回転された N 対 1 結合ステージを詳しく見てみましょう。 (c) バイアス分岐波長選択重みと位相変調器、および (e) 信号ルーティング用のスイッチと入力用の変調器 (\(x_{n,m}\)) と重み ( \(w_{n,m}\))。

図 1a が示すように、ニューラル層のバックボーンは in21 と同様のままですが、主な違いは次のとおりです。 (i) 単一の連続波 (CW) 入力光信号が、それぞれ \(\ を中心とする M 個の多重化 CW 信号に置き換えられます) lambda _m\) と 1 つの独立した仮想ニューロンをサポートし、(ii) 入力変調器と重み変調器は、図 1c、e に示されているより精巧な変調器バンクに置き換えられ、後者の場合はソフトウェア制御可能なスイッチで区切られています。 入力されたマルチチャネル信号は、まず 3dB X カプラーによってバイアス分岐に送られる部分と、残りの部分が光線形代数ユニット (OLAU) に入る部分に分割されます。 OLAU 内では、信号は 1 対 N スプリッターによって電力の観点からさらに均等に分割されます。その例を図 1b に示します。入力 \(x_{n,m} によって適切に変調された後) \) と重み \(w_{n,m}\) によって熟考され、図 1d に示す N 対 1 結合器に送信されます。 この段階で、出力信号は 3dB X カプラー内のバイアスと干渉し、DEMUX に転送されて出力 \(y_m\) を生成します。 最後に、各チャネル m には、指定されたバイアスを持つ重み付き入力の独自の代数加算が行われ、合計 M 個の独立した N ファンイン ニューロンが生成されます。

スイッチの構成に応じて、その概要を表1に示します。図1eの単一軸索内のチャネルは、個別にまたは共通の変調器によって制御でき、ネットワークが次のように動作できるようになります。

マルチニューロン (M 個の独立した N 対 1 ニューロン)。任意の論理相互接続グラフを可能にし、NN の異なる層に異なるニューロンを指定することで多層操作もサポートします。

畳み込み (サイズ N の単一カーネルを備えた M 個の独立した N 要素入力)、すべての異なる入力ベクトルが同じ重みセットを通過します。図 2c、同じカーネルの同時 M 倍使用を達成し、畳み込み演算を高速化します。図2b;

全結合(FC)(M ニューロン上の単一 N 要素入力)。単一の入力が、サイズ N の利用可能な M 個の重みセットすべてを通過し、すべての入力と出力の間の完全な接続が可能になります(図 3a、c)。

省電力 (単一の N 対 1 ニューロン)。フットプリントのペナルティが大きく、総スループットが低いため、主に対象となる動作モードではありませんが、余分なチャネルの電源をオフにすることでリソースを節約でき、 NN が時々 (一度に 1 つのニューロンで) 順次動作する必要がある場合に便利です。

(a) LeNet-5 からインスピレーションを得た簡略化された CNN。画像分類に使用されます。 (b) カラーコード化された入力/出力ペアを備えた畳み込み層の概略図、(c) モード #2 での PPNN 上のその実装。各チャネル m は 1 つの入力/出力ペアに対応します。

(b) オートエンコーダの概略図と、(a)、(c) モード #3 の PPNN 上に実装されたその 2 つの FC 層。チャネルは固有の重みベクトルに対応し、\(y_m\) を出力します。 (b) の接続グラフに基づいて、実装では (a) 最初の層で 4 つのブランチと 2 つの波長、(c) 2 番目の層で 2 つのブランチと 4 つの波長の使用を想定しています。 利用可能な分岐の数 N が必要以上に大きい場合、余分な分岐はすべて入力が 0 に設定されます ((a)、(c) の N 番目の分岐に注目してください。条件 \(N>4\) および \( N>2\) がそれぞれ課せられます)。 実装 (a) のインデックス n は \(n \le 4\) に設定され、点灯した n 番目のブランチがゼロ以外の入力を伝送することを示します。 同様に、使用可能な波長 M の数が必要な波長の数を超える場合、超過した LD の電源がオフになります。

図 1 のアーキテクチャと参加する動作モードの間の詳細なマッピングは、セクション 1、補足文書に記載されており、いくつかの例は図 1、2、3 にも示されています。 畳み込みおよび FC 動作モードは、深層 NN、特に広く使用されている畳み込み NN (CNN) に遍在して存在するため、特に重要です (図 2a11)。 畳み込み層とプーリング層の両方で、図 2b に概略的に示し、図 2 では PPNN 上に実装されているように、独自のカーネル (フィルタリングまたは重み付けウィンドウ) が特定のストライドでスキャン方式で入力に適用され、単一の出力値が得られます。 2c. 一方、図 3a、c に PPNN 上で実装されている FC 層には、出力を生成するために複数の重みセットを通過する単一セットの入力があり、図 3b のオートエンコーダの主要な構成要素です。 CNN では必要ですが、図 2a。 これらの操作はどちらも、逐次的に実行すると時間とエネルギーを消費します。これは、並列化によって大きなメリットが得られることを意味します。

異なる軸索のスイッチは独立して制御できますが、結果として得られる混合型 NN 層には、現時点では応用が期待されていません。 したがって、すべてのブランチのスイッチが次の方法で同期されていると仮定します \(S_{\mathrm {X},n} = S_\mathrm {X}\), \(S_{\mathrm {W},n} = S_\mathrm {W}\) および \(S_{\mathrm {O},n} = S_\mathrm {O}, \forall n\)。 さまざまな動作モードの入力値 \(X_n\) と重み \(W_n\) をカプセル化した行列を表 2 にまとめます。ここで \(I_M\) は \(M \times M\) を表します。単位行列。 入力は正の領域 \(x_{n,m} \in [0,1]\) で定義されるため、値ごとに 1 つ以上の振幅変調器は必要ありません。一方、重みの場合、正の値と正の値の両方を指定できます。負の場合、\(w_{n,m} \in [-1,1]\) の場合、2 つの変調器が必要です。1 つは振幅用で、重みの大きさ \(|w_{n,m}| に比例します) \) と、重みの符号を持つ位相の残り、 \(\varphi _{n,m} = [1 - \mathrm {sgn}(w_{n,m})]\pi /2\)。

図1cに示すバイアスブランチは、図1eの軸索ブランチとは2つの点で異なります。(i)入力シーケンス変調器を持たない。 (ii) 信号が取り得るルートは 1 つだけであり、各チャネルの位相と振幅を個別に制御します。 後者は、OLAU の各軸索で単一の位相および振幅変調器が使用される場合に、入力および重みの大きさの予想される波長依存の変動に対する対抗策として提供されます。 さらに、OLAU 内の異なるチャネルによって蓄積される可能性のある異なる伝送係数と位相オフセットを補償できるため、PNN の最後の 3dB カプラでの強め合う干渉の条件が満たされます。 バイアス行列はすべての動作モードで同じままで、 \(W_\mathrm {b} = \mathrm {diag} [w_{\mathrm {b},1}, \ldots , w_{\mathrm {b},M }]\)、ここで \(w_{\mathrm {b},m} = |w_{\mathrm {b},m}| \exp ( i\varphi _{\mathrm {b},m} )\) 。

光搬送波が M チャネル \(\lambda _m\) で構成され、電場の \(M \times 1\) 列ベクトル \(\mathrm {E}_\mathrm {LD) で表されると仮定します。 } = [E_{\mathrm {LD},1}, \ldots , E_{\mathrm {LD},M}]^\mathrm {T}\)。これらは、大きさの 2 乗が光パワーを生み出すように正規化されています。 , \(E_{\mathrm {LD},m} = \sqrt{P_{\mathrm {LD},m}} \exp (i \varphi _{\mathrm {LD},m})\)。 図 1 に示されているアーキテクチャと補足文書のセクション 2 に示されている詳細な導出に従って、PPNN の出力における電場の列ベクトルは次のようになります。

ここで、図 1a の最後の 3dB X カプラで強めの干渉を確実にするために、バイアスと OLAU からの信号の間の位相整合が実行されます。 前者は \({\widetilde{W}}_\mathrm {b} = W_\mathrm {b} \exp (-i \pi /2)^{\log _2 N}\) を通じて行われます。位相調整を考慮したバイアス分岐チャネルごとの伝達行列。その m 番目の要素は \({\widetilde{w}}_{\mathrm {b},m} = |w_{\mathrm {b},m}| \ exp ( i\varphi _{\mathrm {b},m} ) \exp (-i \pi /2)^{\log _2 N}\)。 すべてのチャネルで同一の累積位相シフトと損失を無視すると、PPNN の伝達行列 \(\mathrm {Q}_\mathrm {t}\) は次のように書くことができます。

\(\mathrm {Q}_\mathrm {t}\) 行列の m 番目の要素 \(q_{\mathrm {t},m}\) は、式 (1) で与えられます。 (2b) マルチニューロン動作モード (#1) では、PPNN の基本的な動作原理が明らかになり、軸索全体で表される N 要素ベクトル間の内積がどのように正規化されるかを示しています \([w_{1,m} , \ldots , w_{N,m}]\) および \([x_{1,m}, \ldots , x_{N,m}]\) は、バイアス \( {\widetilde{w}}_{\mathrm {b},m}\) をそれに重ね合わせます。 PPNN の再構成可能性は式 (1) に隠蔽されています。 (2a) ここで、行列 \(X_n\) と \(W_n\) の選択は、表 2 に従って動作モードによって制御され、代替関数が得られます。 畳み込みモード (#2) では、図 2b のような単一のカーネル、つまり、異なるチャネルにわたる単一の重みセット \([w_{1,0}, \ldots , w_{N,0}]\)、 \(w_{n,m} = w_{n,0}, \forall m\) であるため、軸索ごとに共通の重み変調器が必要ですが、入力ベクトルはチャネル間で異なるままです \([x_{1,m}, \ldots , x_{N,m}]\)、結果として畳み込み演算の M 倍並列化とその結果の高速化が実現します。 一方、FC モード (#3) では、単一の入力ベクトル \([x_{1,0}, \ldots , x_{N,0}]\) が 1 つの入力変調器 \(x_{n ,0}\) は n 番目の軸索ごとに、複数のチャネル選択的重み \([w_{1,m}, \ldots , w_{N,m}]\) を通過し、すべての N 入力間の完全な接続が得られます。図3bに示すように、(x_{n,0}\)とすべてのM出力\(y_m\)。 最後に、省電力モード (#4) では、一意の重みと入力ベクトル \([w_{1,0}, \ldots , w_{N,0}]\) と \([x_{1,0} , \ldots , x_{N,0}]\)、1 つのチャネルのみを使用し、残りのチャネルの電源をオフにすることができ、追加の電力ペナルティなしでデュアル IQ ドット積エンジン from21 と同じ機能を提供します。ただし、PPNN のプログラマビリティとマルチチャネル設計によって課せられるフットプリントのペナルティは発生します。 この動作モードは確かに好ましいものではありませんが、プロトタイピング段階など、再構成可能性がシステムの必要な機能である場合、次の形式で、通常は並列動作を含む逐次動作に直面したときに電力を節約できます。セットアップと分析の手順。

前に述べたように、式。 (2b) はモード #1 に与えられていますが、チャネル固有の \(x_{n,m}\) および/または \(w_{n,m}\) をジョイントで置き換えることによって、他のモードに更新できます。 \(x_{n,0}\) および/または \(w_{n,0}\)。 以下では、明示的に別段の記載がない限り、簡略化および明確化のために、任意の操作モードに対して \(x_{n,m}\) および \(w_{n,m}\) の表記を使用します。

画像分類などの特定のアプリケーション シナリオでは、図 2a、b のように、通常は奇数である線形フィルター (カーネル) 次元の 2 乗として軸索の数を選択すると便利です。結果として、たとえば \( N = 3 \times 3\) または \(N = 5 \times 5\)。 他の一部のアプリケーションでは、必ずしも正方形ではなく、任意の N が必要になる場合があります。 この場合、図 1 の PPNN アーキテクチャを活用するために 2 つのアプローチを採用できます。ただし、図 1b、d のスプリッタとコンバイナが N が 2 の累乗であると想定して設計されていることを念頭に置いてください。最初のアプローチは単純で、次のことを前提としています。 N 個の必要な軸索を使用し、N より大きい最も近い 2 のべき乗数を補う残りの軸索は無視します。この場合、一定量の光学パワーが失われますが、\(N/ 2^{ \lceil \log _2 N \rceil }\)、損失が 3dB を超えることはありません。 2 番目のアプローチは、スプリッターとコンバイナーを再設計することを犠牲にして電力損失を排除することを目的としており、すべての経路に沿って同一の位相シフトをアサートし、その結果、異なる軸索に沿って伝わる信号間のコヒーレンスが維持されます。 このようなスプリッターと対応するコンバイナーを設計するためのアルゴリズムは、補足文書のセクション 3 に示されています。

単一のアクティブ チャネルを使用して PPNN を省電力モードで動作させると、軸索の DE/MUX をバイパスし、すべてのパッシブ (スプリッタ、コンバイナ) およびアクティブ コンポーネント (スイッチ、入力、および重み変調器) をチャネルの中心波長に集中させる可能性が広がります。光学コンポーネントの波長依存特性による出力低下の余地がありません。 一方、マルチチャネル PPNN (モード #1 から #3) があると、行列要素 \(q_{\mathrm で与えられる、ターゲットの出力間の相対誤差が同様になるため、すべてのチャネルが同等に動作するかどうか) について懸念が当然生じます。式の {t},m}\) (2b)、実験的に得られた値 \(q_{\mathrm {e},m}\)。 DE/MUX でのクロストークに伴う波長依存の損失と位相の蓄積は、絶対値 \(\Delta q_m = q_{\mathrm {e} ,m} - q_{\mathrm {t},m}\)、および行列要素間の相対誤差 \(\delta q_m = |\Delta q_m|/q_{\mathrm {t},m}\) 。 ネットワークのエラー許容度は、ネットワークが使用される割り当てとトレーニング アルゴリズムに依存するため、許容可能な相対誤差の制限を設定することは困難な作業になる可能性があります。 経験則として、許容可能な PPNN 誤差はトレーニング誤差よりも小さい必要があり、通常は数パーセントの範囲にあります21、22、23。 さらに、ノイズを意識したトレーニング アルゴリズムを採用すると、ノイズの多い環境でも NN モデルの回復力が向上することが証明されています 24。ノイズとは、目標とする出力からのランダムに分布した偏差をカプセル化する広義の用語として理解する必要があります。 上記の内容に従って、このセクションでは実験的な PPNN 伝達行列 \(\mathrm {Q}_\mathrm {e}\) が目標の伝達行列 \(\mathrm {Q} からどれだけ逸脱するかを調査することにしました。 _\mathrm {t}\)、そしてこの偏差を打ち消すことができるかどうか。

解析は、ステージの分割と結合に使用される X カプラーと、軸索内の信号ルーティングに使用される光スイッチの波長依存性の影響を調べることから始まります。 以下では、軸索の数 N は 2 のべき乗であると仮定され、分割および結合ステージがカスケード接続された 3dB X カプラーで構成されていることを意味します。 それにもかかわらず、補足文書のセクション 3 で概説されているスプリッター/コンバイナーの設計に従って、すべての結論は任意の数の軸索 N に一般化できます。 m 番目のチャネルのカプラーの波長依存パワー分割比は、 \(\alpha _m = 1/2 + \Delta \alpha _m\) と書くことができます。ここで、 \(\Delta \alpha _m\) は、目標値は1/2。 3 つのスイッチ \(S_\mathrm {X}\)、\(S_\mathrm {W}\)、および \(S_\mathrm {O}\) はすべて、波長依存の損失ペナルティを導入すると想定されます。アクティブ ポートに転送される光パワーの量は \(s_m \le 1\) に比例します。 補足文書のセクション 4 で報告されている詳細な研究によると、PPNN からの出力電界は列ベクトル形式であることがわかります。

ここで、 \(\mathrm {S} = \mathrm {diag} \left[ \sqrt{s_1} , \ldots , \sqrt{s_M} \right]\) はスイッチの伝達行列を表し、 \(\mathrm {A }_\mathrm {バー/クロス} = \mathrm {diag} \left[ \sqrt{1 \mp 2 \Delta \alpha _1} , \ldots , \sqrt{1 \mp 2 \Delta \alpha _M} \right ]\) は、X カプラーのバー/クロス伝達マトリックスを表し、両方とも波長に依存します。 出力 3dB カプラーでの強めの干渉を確保し、結果として生じる出力フィールドの符号整合性を維持するには、バイアス ブランチ内での位相補償とチャネルごとの損失バランスが必要です。これは、修正された重み行列 \({\widetilde{W}}_ によって実現されます) \mathrm {b}\)、その m 番目の要素

(4) の \(w_{\mathrm {b},m}\) を考察する係数と、(3) の \(\mathrm {Q}_\mathrm {t}\) を考察する係数はどちらも、次の性質にのみ依存します。スイッチと X カプラーの影響を受け、入力シーケンスや重みに関係なく変更されません。 (3) を (1) ~ (2) で与えられる理想的なケースと比較すると、干渉条件は (4) に従ってバイアス振幅と位相を個別に制御することによってうまく満たされることがわかります。 チャネルが異なれば蓄積される損失の量も異なりますが、この不均衡は、PPNN の逆多重化出力に一連の可変光減衰器 (VOA) を使用することで簡単に相殺できます (図 1a を参照)。 PPNN の中核の外でこの課題を解決できる可能性があるため、この時点から、X カプラーとスイッチの波長依存性は重要ではないと仮定し、ターゲットのマトリックスの劣化を引き起こす可能性のある障害に焦点を当てます \( \mathrm {Q}_\mathrm {t}\)。

入力 \(x_{n,c}\) を実装するために、研究ではマッハツェンダー変調器 (MZM) を使用します。c は、MZM が中心となるチャネル \(\lambda _c\) のインデックスです。 MZM の両アームに電圧制御位相シフタ (PS) があり (上アームと下アームにそれぞれ「1/2」とインデックスが付けられます)、DC 誘起位相シフトが \(\ として与えられるプッシュプル構成で動作すると仮定します。 phi _{\mathrm {DC},1/2} = 2\pin(V_{\mathrm {DC},1/2}, \lambda ) L_\mathrm {DC}/\lambda\) および RF は次のように誘導されます。 \(\phi _{1/2}(\pm V_\mathrm {RF}, \lambda ) = \phi _0 (\lambda ) \pm \Delta \phi (V_\mathrm {RF}, \lambda )\) \(\phi _0 = 2\pi n_0(\lambda ) L /\lambda\) と \(\Delta \phi = 2\pi \Delta n(V_\mathrm {RF}, \lambda ) L /\lambda を使用します。 \) ここで、L と \(L_\mathrm {DC}\) は、RF および DC のアクティブ領域の長さ、および \(n = n_0 + \Delta n\) を示します (\(n_0\) と \(\Delta n\) ) は、印加電圧がゼロのときの屈折率と、電圧が印加されたときのその偏差です。 MZM の伝達関数は次のように与えられます。

そして、 \(\pi\) で区切られた位相シフトを引き起こす DC 電圧 (バイアス) を選択することにより、 \(t_\mathrm {MZM} (\lambda _c) = x_{n,c}\) になるように調整されます。これは \ を意味します。 (\phi _{\mathrm {DC},1} = \phi _\mathrm {DC} - \pi\) および \(\phi _{\mathrm {DC},2} = \phi _\mathrm {DC }\)。 変調による位相変化が全体の波長依存性に大きく寄与しないと仮定すると、MZM 伝達関数は次のように近似できます。

動作モード #3 および #4 の場合、MZM 伝達関数は特定の \(\lambda _c\) を中心とします。つまり、次のことを強制することにより、指定されたチャネルでターゲット入力 \(x_{n,c}\) を配信するように最適化されます。 \(\Delta \phi (V_\mathrm {RF}, \lambda _c) = \arcsin x_{n,c}\) と式の指数関数の引数の設定 (5) \(2\pi\) の倍数になります。 他のチャネル m の場合、インプリントされた値 \(x_{n,m,c}\) は目標値から逸脱します。 補足文書のセクション 5 に記載されている入力変調器の動作の詳細な分析に従って、位相 \(\phi _0 (\lambda )\) の 1\(\mathrm{{st}}\) 次のテイラー展開に依存します。 \(\phi _\mathrm {DC} (\lambda )\) \(\lambda _c\) の周りで、n 番目の軸索の m 番目のチャネルが次の式で与えられる入力値を運ぶことがわかります。

ここで、 \(p_x = n_0(\lambda _c) L/\lambda _c\) および \(q_x = n(V_\mathrm {DC},\lambda _c) L_\mathrm {DC}/\lambda _c\) は、 MZM 内の RF および DC 移相器の正規化された長さで、\(p_x, q_x \in {\mathbb {N}}\)、\(n_\mathrm {g}\) は群屈折率、\ に制限されます。 (\Delta \lambda _1 = \lambda _{m+1} - \lambda _m\) はチャネル間隔を表します (チャネルが等距離であると仮定)。 パラメータ \(\xi _{m,c}^{(x)}\) は、チャネル m によって蓄積された位相シフトを表し、次の 4 つの重要な事実を明らかにします。 (i) ターゲットの \(x_{n,c} には依存しません) \) 位相累積が入力シーケンスによって変化しないことを意味する値。 (ii) それは軸索インデックス n に依存せず、すべての軸索が同量の位相蓄積を導入し、OLAU 自体の内部ではなく OLAU の外部で補償できることを意味します。 (iii) これは、m と c の差に依存します。これは、同じ次数のすべてのサイド チャネルが同じ位相累積を持ち、その大きさが \(|mc|\) とともに増加することを意味します。 (iv) チャネル間隔 \(\Delta \lambda _1\) とともに増加します。

重み \(w_{n,c}\) を実装するには、MZM と独立した PS の組み合わせを使用できます。 対象となるアプリケーションに応じて、振幅変調は、吸収制御4、8、23、または T/O または E/O PS を使用した干渉モジュール 9、10、22 の採用によって実現できます。 報告されている推論を対象とした最先端のコヒーレント レイアウトの大部分に合わせて、再構成速度を遅くすることを可能にするため、MZM のアーム内とそれに続く PS の両方で熱制御された PS を選択します。 ここで、E/O (入力) 変調器と T/O (重み付け) 変調器の共統合には、熱クロストークを避けるために慎重な計画が必要ですが、ここ数年で十分に確立されたプロセスとなり、オンチップでの重要なデモンストレーションが行われたことに注意してください。シリコンベースのトランシーバー 25 とニューロモーフィック フォトニクス 22、23 の両方の分野における共集積 E/O 構造と T/O 構造の研究。 Si や InP プラットフォームを含む多様な PIC プラットフォームで両方のデバイスタイプの信頼性の高い動作を保証するために、必要に応じて、断熱トレンチやヒートシャント 26、27、あるいは熱固有モード分解 28 などのより複雑なアプローチの採用を追加で行うことができます。 E/O MZM とは異なり、T/O MZM はプッシュプル構成では動作できません。 代わりに、アームの一方または両方の導波路の長さを変更することで非対称にすることができ、公称温度 \(T_0\) で \(2 \theta\) の組み込み位相差を実現します。 \(\lambda _c\)、言い換えれば、\(2\theta\) 点で偏ることになります。 どの時点でも、\(|w_{n,c}|\) と \(\cos \theta\) の比率に応じて重みの大きさを調整するために 1 つの PS だけが使用されます。 これは、MZM-PS システムの電界伝達関数に反映されます。

ここで、 \(\phi (T_0, \lambda ) = 2\pi n (T_0, \lambda ) L/\lambda\) は、\(T_0\)、\(\Delta \phi (\Delta) で MZM に蓄積された位相です。 T, \lambda ) = 2\pi \Delta n (\Delta T, \lambda ) L/\lambda\) は、適用された温度差 \(\Delta T\) および \(\phi _3 ( T, \lambda ) = 2\pi n (T, \lambda ) L_3/\lambda\) は、スタンドアロン PS に蓄積された位相です。 入力 MZM の場合と同様に、波長による \(\Delta \phi\) 変動の寄与を無視し、MZM-PS 伝達関数を次のように近似できます。

\(\lambda _c\) を中心とすることを考慮すると、 \(t_\mathrm {MZM-PS} ( \lambda _c ) = w_{n,c}\) が得られ、 \(\phi (T_0) も意味します。 、 \lambda _c) = 2 p_w \pi\) および

ここで \(p_w, p_s \in {\mathbb {N}}\)。 任意のチャネル \(m \ne c\) については、1 次近似に制限されたままで、実用的な関心のあるすべてのケースで予想される \(p_w, p_s \gg 1\) を仮定します。これは、第 6 章の詳細な導出に従います。補足文書では、n 番目の軸索の m 番目のチャネルが重みを運ぶことがわかります。

ここで、 \(p_w = n(T_0,\lambda _c) L/\lambda _c\) および \(p_s = n(T_0,\lambda _c) L_3/\lambda _c\) は、MZM 内の PS の正規化された長さを表し、それぞれスタンドアロン PS、L と \(L_3\) はその長さです。 \(\xi _{m,c}^{(x)}\) について先ほど挙げた結論と同じ結論が \(\xi _{m,c}^{(w)}\) にも当てはまります。

信号の多重化と逆多重化には、対象の周波数帯域にわたってフラットなチャネル方向のスペクトル応答を備えたアレイ導波路回折格子 (AWG) が使用されます。 AWG のパワー伝達関数はチャネルの波長を中心として対称な対数領域の放物線として与えられ、全体的な損失は無視できると仮定します。 線形領域では、伝達関数は遠視野の形状、つまり波長に対するガウス関数に対応します29。 AWG のクロストークは、最初の抑制されたチャネルとパス チャネルのパワーの比として定義され、線形用語では \(r_\mathrm {AWG}\)、または \(R_\mathrm {AWG}\) として表されます。対数 (dB) 領域で。 以下では、挿入損失 (IL) がゼロであると仮定し、クロストークが隣接するチャネル間でのみ関係すると仮定する 1\(\mathrm{{st}}\) 次の近似に限定します。 また、AWG の出力自由伝播領域の曲率がガウス場 (横断面の等位相線) の曲率と一致し、隣接する出力導波路間の位相差がゼロになると仮定します。

DEMUX を通過すると、チャネル m は m 番目の出力ポートだけでなくポート \((m \pm 1)\) にも分配され、電力の比率は \(r_\mathrm {AWG} によって決まります\)。 これにより、隣接する導波管の m 番目のチャネルが、チャネル \((m \pm 1)\) を対象とした入力または重みによって変調されます。 その後、MUX によって収集されると、逆のプロセスが続き、すべての信号が出力に収集され、3 つの隣接するパスに属する入力または重みが適切な係数で混合されます。 補足文書のセクション 7 に示されている詳細な導出に従って、動作モード #1 および #2 での入力の実際のインプリントされた値が、次のように目標値から逸脱していることがわかります。

制約 \(x_{n,0} = x_{n,M+1} = 0\) の下で、モード #1 と #3 の重みとすべての動作モードのバイアスに同じ形式が適用されます。 複数のチャネルに単一の変調器を使用することで生じる偏差はある程度補償できますが、AWG から発生するクロストークはパターンに依存しており、したがってインデックスとインデックスの両方に依存するため、OLAU の外側で簡単に打ち消すことはできません。軸索 n とチャネルのインデックス m。

PPNN の構成コンポーネントの波長依存の動作が特定されたので、その実験的な対角伝達行列 \(Q_\mathrm {e}\) は、表 1 および 2 に示すように、さまざまな動作モードの PPNN 構成に基づいて導出できます。式1に基づいて、図1eの信号の経路をたどります。 AWG 応答をモデル化するための式 (12)、および式 (12) (5) および (8) は、近似されていない入力および重み変調器の伝達関数です。 式 (1) の \(Q_\mathrm {t}\) の場合と同様です。 (2a) では、 \(Q_\mathrm {e}\) に蓄積された位相シフトを無視し、バイアス ブランチと OLAU の間、および OLAU 自体の軸索間の位相差のみに焦点を当てます。干渉状態の悪化によりパフォーマンスが低下する可能性があります。 入力または重みを複数のチャネルに適用するために単一の変調器を使用することを想定した動作モード (入力の場合はモード #3、重みの場合は #2) でバイアス ブランチと OLAU の間の位相調整を実行するために、バイアス ブランチの転送を変更します。モード #2 の \({\widetilde{W}}_\mathrm {b}\) から \({\widetilde{W}}_\mathrm {b} \Xi _c^{(w)}\) までの行列またはモード #3 の \({\widetilde{W}}_\mathrm {b} \Xi _c^{(x)}\)、ここで

\(\xi _{m,c}^{(x)}\) と \(\xi _{m,c}^{(w)}\) は式によって定義されます。 それぞれ (7b) と (11b)。 このようにして、式(1)および(2)から得られるチャネル選択的な位相累積が得られる。 (7a) および (11a) は、補足文書のセクション 8 に詳述されているように、取り消されます。 \(Q_\mathrm {e}\) は式に基づいて導出されるということを強調しておく必要があります。 (7)、(11)、(12) は近似値であり、バイアス ブランチの PS を介して位相補償が実行されたとしても、\(Q_\mathrm {t}\) からの一定の偏差が残ります。 今後の分析では、これらは絶対誤差 \(\Delta q_m = q_{\mathrm {e},m} - q_{\mathrm {t},m}\) と相対誤差 \(\delta q_m = |\Delta q_m|/q_{\mathrm {t},m}\)、実験 \(q_{\mathrm {e},m}\) とターゲット \(q_{\mathrm { t},m}\)、対角行列要素。 誤差は、補足文書のセクション 8 にある \(q_{\mathrm {e},m}\) と \(q_{\mathrm {t},m}\) を相関させる式に基づいて導き出すことができます。

私たちのケーススタディでは、さまざまな温度での波長に対する屈折率の依存性を 30 から取得したシリコン プラットフォームを想定しています。 \(\lambda _c = 1.55 \, \mu \mathrm {m}\) と \(T_0 = 293 \, \mathrm {K}\) では、 \(n = 3.4757\) と \(n_\mathrm { g} = 3.5997\)。 E/O 変調器の場合、ドーピングが厳しい場合や複合材料が使用されない限り、ドープされていないシリコン (光の大部分が閉じ込められる) の光学特性は上記と同じままですが、屈折率の依存性は変わりません。電圧は、対象の電圧範囲に対してほぼ線形であると想定されます。

モンテカルロ法を使用して、領域 \(x_{n,m} \in [0,1]\) および \( w_{n,m} \in [-1,1]\) を使用し、バイアスを \({\widetilde{w}}_{\mathrm {b},m} = 1\) に固定して、次のことを保証します。和の符号に関する情報は、パワー ドメインに移行するときに保持されます。 トレーニングされた環境で PPNN を使用する場合、バイアスの重みは、トレーニング アルゴリズムによって課された \({\widetilde{w}}_{\mathrm {b},m} \in [-1,1]\) の任意の値を取ることができます。 シミュレーションの後、対角行列要素 \(q_{\mathrm {t},m}\) と \(q_{\mathrm {e},m}\) が集計され、多変量統計手法を使用して 2 次元散布図が分析されます。絶対誤差と相対誤差の観点から偏差を決定します。

\(M=4\) チャネルでの PPNN 動作の畳み込み (#2、左側) モードと完全接続モード (#3、右側) の比較。チャネル \( c=2\)、\(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\) および \(R_\mathrm {AWG} = -15 \, \mathrm の \(N=8\) 軸索{dB}\)。 ターゲットの行列要素 \(q_{\mathrm {t},m}\) と (a)、(b) の大きさと (c)、(d) 引数のチャネルごとに色分けされた 2 次元散布図実験行列要素 \(|q_{\mathrm {e},m}|\) および (e)、(f) 実験行列要素とターゲット行列要素の絶対偏差の代数的大きさ \(\mathrm {sign} ( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\)、\(\Delta q_m = q_{\mathrm {e},m} - q_ {\mathrm {t},m}\)、すべて、散布図の対応する横軸と縦軸に一変量カーネル確率密度プロットが表示されます。

図 4 は、T/O MZM バイアス点 \(\theta = \pi /3\ の、畳み込み (左側) と FC (右側) という 2 つの異なる動作モードの 2 次元散布図を示しています。 )、正規化された長さ \(p_x = q_x = 100\) および \(p_w = p_s = 50\)、公称チャネル間隔 \(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\)、換算するとおよそ \周波数領域では (100 \, \mathrm {GHz}\)、\(R_\mathrm {AWG} = -15 \, \mathrm {dB}\)。 バイアス分岐と OLAU 出力の間の位相調整は、式 1 に従って実行されます。 (13)。

実験的な行列要素 \(|q_{\mathrm {e},m}|\) と対象となる行列要素 \(q_{\mathrm {t},m}\) の大きさに関しては、両方のモードで図 4a、b で確認できるように、単一の変調器を使用した場合の PPNN の \(M=4\) 色分けされたチャネルのうち、同じチャネル \(c = 2\) に対して最適化した場合、動作は同様のパフォーマンスを示します。が使用されるか、チャネルごとに変調器が使用される場合は m に最適化されます。 図4a、bに示す両方のケースのスピアマンの順位相関係数 \(\rho\) は、観測された4つのチャネルすべてで0.999を超えており、2つの量の間にほぼ完全な単調関係があることを示しています。 \(q_{\mathrm {t},m}\) と \(|q_{\mathrm {e},m}|\) の両方の一変量確率密度関数 (PDF) は、中心極限定理に従ってガウス形状を維持します。 (CLT)。 それにもかかわらず、エッジ チャネルの PDF の平均値のわずかな下方シフト (\(m=1\) および \(m=4\))、つまり実験行列要素の平均値の減少が観察されます。対象のものとの比較。 ダウンシフトは、PPNN を介した伝播中にエッジ チャネルが内部チャネルよりも大きな電力損失に遭遇することを意味します。これは、入力バンクと重みバンクに変調器を組み込んだ DEMUX/MUX ペアに起因すると考えられます。 つまり、エッジ チャネルが逆多重化されると、その光パワーの一部はクロストーク強度 (\(r_\mathrm {AWG}\)) に比例し、PPNN でサポートされていない隣接チャネル (\ のチャネル 0) に送信されます。 (m=1\) および \(m = M\) のチャネル \(M+1\)) は逆多重化ステップ中に不可逆的に失われます。 補足文書のセクション 7 で説明されているように、内部チャネルは PPNN によってサポートされる隣接チャネルにクロストーク信号を分配し、後で MUX によって収集できるため、この効果は内部チャネルでは観察されません。 このエッジチャネル損失ペナルティは、\(x_{n,0} = x_{n,M+1} = 0\) および \(w_{n,0} = w_{n,M+1} = 0 によって取得されます。式の \) (12) とそれに対応する \(w_{n,m}^\mathrm {AWG}\) 。

図 4c、d に示す \(q_{\mathrm {e},m}\) と \(q_{\mathrm {t},m}\) の引数の散布図は、以下に基づいて位相が揃っていることを明らかにします。式(1)、(2)で与えられる近似式。 (7b) と (11b) は優れた結果をもたらし、残留位相シフトは \(0.01\pi \, \mathrm {rad}\) 未満になります。 \(\mathrm {arg}(q_{\mathrm {e},m})\) の分布は、CLT のおかげでガウス関数でよく近似され、対象となる行列要素 \(q_{\mathrm { t},m}\) 値。 \(q_{\mathrm { e},m}\)、1\(\mathrm{{st}}\) および \(M\mathrm{{th}}\) チャネルで見られる非対称な位相シフトから生じます。 ただし、今回は平均値のシフトの符号が異なります。1\(\mathrm{{st}}\) チャネルでは正、\(M\mathrm{{th}}\) チャネルでは負です。 どちらの場合も、シフトはバイアス ブランチのクロストークから発生し、位相補償が実行されます。 (12) のバイアスに対応する項を見ると、クロストーク項は \(r_\mathrm {AWG} ( {\widetilde{w}}_{\mathrm {b},m-1} - 2 {\widetilde{ w}}_{\mathrm {b},m} + {\widetilde{w}}_{\mathrm {b},m+1} )\)、および \({\widetilde{w}}_サポートされているすべてのチャネル \(m \in [1,M]\) の {\mathrm {b},m} = 1\) は 0 になるはずです。ただし、 \(m = 1\) または \(m = M\)、 \({\widetilde{w}}_{\mathrm {b},0} = {\widetilde{w}}_{\mathrm {b},M+1} = であるため、信号は相殺されません。 0\)、\(-r_\mathrm {AWG}\) に比例する残留クロストーク項を残し、これに \(\Xi _c^{(x)}\) または \(\Xi _c^{(w )}\) 補足文書のセクション 8 で詳細に説明されているように、動作モードに応じて異なります。 一方、\(\Xi _c^{(x/w)}\) の要素は、(7b) のように、観測されたチャネル m と変調器が中心となったチャネル c との差に依存します。および(11b)を示します。 これにより、1\(\mathrm{{st}}\) チャネルと \(M\mathrm{{st}}\) チャネルの異なる符号の位相シフトが生じます。これは、一般的な選択は \(c = \lceil M であるため) です。 /2 \rceil\)。 シフトされた平均値に関係なく、対応する準ガウス PDF の標準偏差は、内部チャネル (\(m = 2\) および \(m = 3\)) の場合と同様のままです。

最後に、図 4e、f では、実験とターゲットの伝達行列要素の間の絶対誤差の代数的大きさ \(\mathrm {sign}( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\)。 図4a、bで観察されたエッジチャネルの平均ドリフトの影響は定量化でき、分析されたすべてのケースで\(|\Delta q_m| < 0.06\)未満に留まり、次のオーダーの最大相対誤差が得られます。 \(4 \%\) エッジ チャネルの場合。 内部チャネルの場合、誤差は 0 付近に集中し、特定の \(\Delta \lambda _1\) および \(R_\mathrm {AWG}\) に対して、次の範囲で \(2 \%\) 未満に留まります。 \(> 90\%\) の分析されたランダム セット。

表 1 に従って、\(\Delta \lambda _1\) を 0.4 から \(1.6 \, \mathrm {nm}\) まで (グリッド間隔は 50–\( \(-\,40\) から \(-\,5 \, \mathrm {dB}\) までの 200 \, \mathrm {GHz}\)) と \(R_\mathrm {AWG}\)すべてのチャネルに単一の変調器が使用される場合は \(M=8\) チャネルが \(c = 4\) を中心とし、それ以外の場合は m を中心とし、行列要素の相対誤差に対するさまざまなシステム パラメータの影響を決定することを目的としています。 \(\デルタ q_m\)。 図 5 は、\(10^4\) 個の分析サンプルの集合における相対誤差の平均値と、\(-15 \, \mathrm {dB}\) と \(0.8 \, \mathrm {nm}\) のチャネル間隔の \(R_\mathrm {AWG}\) の比較。 図 4 の散布図で観察されたように、図 5 に基づいて、エッジ チャネル (\(m=1\) と \(m=8\)) が同様の量の誤差を導入している (線が重なっている) ことを再度確認します。これは内部チャネル (\(2 \le m \le 7\)) で発生する誤差よりも大きく、チャネル間でも重複します。 根本的な原因は、前に詳しく説明したように、AWG を通過するときにエッジ チャネルによって蓄積されるフィールドの大きさと位相シフトの非対称性に関連しています。 この重複から得られる重要な結論は、位相補償が式 (1) に続くバイアス ブランチ内で行われる限り、使用されるチャネルの数 M はどの PPNN 動作モードにも問題を引き起こさないということです。 (13)。

(a)、(b) マルチニューロン、( c)、(d) 畳み込み、および (e)、(f) FC 動作モード。 (a)、(c)、(e) \(R_\mathrm {AWG} = -15 \ のチャネル間隔に依存) \mathrm {dB}\) と (b)、(d)、(f) \(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\) の AWG クロストーク。

図 5 でさまざまな動作モードを比較すると、平均相対誤差は、エッジ チャネルで高くても内側チャネルで低くても、さまざまな動作モードでほぼ同様のままであることがわかります (非常に高い \(R_\mathrm {AWG} を除く) \))、\(R_\mathrm {AWG}\) よりも \(\Delta \lambda _1\) への依存性が弱くなります。 \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\) の場合、解析された \(\Delta \lambda _1\) については \(4 \%\) を超えませんが、クロストークとして増加すると、平均誤差は指数関数的に上昇し、\(R_\mathrm {AWG} = -10 \, \mathrm {dB}\) でエッジ チャネルの \(10 \%\) を超え、最大 200 の管理可能な値の範囲内に留まります。 \(R_\mathrm {AWG} = -5 \, \mathrm {dB}\) であっても内側のものは \(6\%\) です。 一方、動作モード間には信頼区間に大きな差があります。図 5a、b に示すように、マルチニューロン動作モードでは信頼区間が最も広くなり、図 5a、b に示すように畳み込みモードと FC モードでは小さくなります。図 5c–f は、一般的ではありませんが、複数のニューロンの場合に大きなエラーが発生する可能性があることを示唆しています。 AWG クロストークに関しても同様の信頼区間の変化が見られます (図 5b、d、f)。これは、残りの 2 つの動作モードと比較して、モード #1 により多くの DE/MUX 段があることが実際にそのかなりの広がりの原因であることを明らかにしています。式に基づいて予想されるエラーの数。 (12)。

畳み込み動作モード(図 5c、d)と FC 動作モード(図 5e、f)を見ると、信頼区間に違いが観察され、内部チャネルの平均相対誤差にもある程度の違いが観察され、畳み込みモードがそのことを示しています。動作の全体的なパフォーマンスが向上しているようです。 ただし、アーキテクチャの観点から見ると、図は次のとおりです。 1、2、3、この 2 つはほぼ互換性があります。 同時に、私たちの分析では、正規化された変調器の長さ \(p_x\)、\(q_x\)、\(p_w\)、\(p_s\) が予想どおり、相対誤差平均と信頼区間においてわずかな役割しか果たしていないことが示されました。式によって与えられる累積位相を念頭に置いてください。 (7b) と (11b) は、式 (7b) に従うバイアス変調器バンク内の PS によって補償されます。 (13)。 したがって、その違いは、入力と重みの異なる領域、つまり、すべてのチャネルに同時に適用される量とチャネルごとに適用される量に応じて生じます。 入力と同じ領域に制限された重み、つまり \(w_{n,m} \in [0,1]\) に対して図 5 の分析を繰り返すと、両方の動作モードで信頼区間がわずかに減少することが確認されます。さらに重要なのは、大きさが同じになることです。 これは、FC 動作モードにおける重み変調器バンクのクロストークの大きさを、式 1 と同等の \(w_{n, m \pm 1}\) が取り得る値の範囲を半分に減らすことで説明できます。 (12) \(w_{n,m}^\mathrm {AWG}\) の場合。

\(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\) および \(R_\mathrm {AWG} = - におけるニューロン ファンイン N に対する相対誤差 5 ~ 95% 信頼区間 (% で指定) 15 \, \mathrm {dB}\) (a) 畳み込みモードおよび (b) 全接続モードの場合。

ファンインにおける PPNN のパフォーマンスの研究は、2 ~ 64 の範囲の N に対して実行され、畳み込み構成と FC 構成について図 6 に報告されています。 どちらの操作モードでも、 \(q_{\mathrm {t},m}\) と \(|q_ の両方の一変量 PDF が狭くなることにより、N の増加とともに信頼区間が減少するという明確な傾向が観察できます。 {\mathrm {e},m}|\)、CLT に準拠しており、標準偏差は \(1/\sqrt{N}\) とともに減少します。 平均相対誤差の値は、異なる N 値にわたって図 5 の値と同様のままであり、他の分析パラメータと同様に、軸索の数が PPNN の動作に問題を引き起こさないことを意味します。

ここでは、挿入損失 (\(\mathrm {IL}_\mathrm {PPNN}\))、消費電力 (\(P_{\mathrm {PPNN},m}\)) に焦点を当てて、PPNN 実装の実際的な側面について説明します。 、フットプリント (\(A_{\mathrm {PPNN},m}\)) とスループット (\(T_{\mathrm {PPNN},m}\)) を合わせてエネルギー効率とフットプリント効率を形成します。スループットと消費電力または PPNN エリアの比。 一部の LD の電源をオフにしたり、一部の軸索を暗くしたりするなど、次善のリソース使用によって生じるペナルティを認識しています。つまり、使用するチャネルの数を減らしたり (\(M_A \le M\))、軸索の使用を減らしたり (\(N_A) \le N\)) は PPNN がサポートするものよりも優れています。 補足文書のセクション9で報告された詳細な研究に基づいて、2のべき乗の分割および結合ステージのアクティブチャネル数ごとのそれぞれの値を求めます。

ここで、\(\mathrm {IL}_i\)、\(L_i\)、\(P_i\) はデバイスごとの挿入損失、長さ、消費電力を表します。ただし、\(P_\mathrm {LD}\) は例外です。はチャネルごとの LD の光パワーを表します。 インデックス \(i\in \mathrm {\{MUX,S,C,X,W,R\}}\) は、指定された順序で DE/MUX、スイッチ、X カプラー、入力振幅変調器、重みを参照します。振幅と位相の変調器と導波路のルーティング。 さらに、\(\eta _\mathrm {wp}\) は LD のウォールプラグ効率、\(L_\mathrm {A}\) は軸索の全長、\(L_\Delta\) の距離です。側方導波路間では、 \(B_\mathrm {X}\) は入力変調器のデータレート、 \(\mathrm {S}_\mathrm {\{X,W,O\}}\) はスイッチの状態です動作モードに応じて表 1 で定義されます。

(14a) の \(\mathrm {IL}_\mathrm {PPNN}\) の最初の 2 つの項は、マルチチャネル操作によって導入されるペナルティを示します (\(\sim \mathrm {IL}_\mathrm {MUX}\))とプログラマビリティ (\(\sim \mathrm {IL}_\mathrm {S}\))、一方、最後の項は、\(N_A < N\) 軸索が使用された場合に不可逆的に失われる光学パワーの形でのペナルティを示します。 \(M_A < M\) チャネルが使用される場合、IL ペナルティは観察されません。

(14b) で与えられるチャネルごとの PPNN の電力消費は、すべてのアクティブ コンポーネントによって制御され、スイッチの状態と動作モードに基づいてパワーオンされます。 オプションのトランスインピーダンス アンプ (TIA) と温度コントローラー (TEC) の消費電力は、マルチチャネル動作や PNN のプログラマビリティに関係なく、同様に総消費電力に寄与するため、分析から除外されています。 前世代のデュアル IQ コヒーレント線形ニューロン 21 と比較すると、モード #1 および #4 での PPNN の消費電力はデュアル IQ の消費電力と同様ですが、PPNN ではわずかなペナルティ \(\sim P_\mathrm {S}\) が発生します。プログラム可能であるため、このケースに当てはまります。 ただし、モード #2 (畳み込み) または #3 (完全接続) で動作すると、係数が \(P_\mathrm { W}\) と \(P_\mathrm {X}^\mathrm {(DC)/(RF)}\) は、それぞれアクティブなチャネルの数 \(M_A\) で除算され、エネルギー効率の向上を意味します。 \(M_A\) デュアル IQ ニューロンを使用した場合と比較した PPNN の結果。

(14c) で与えられるチャネルごとの PPNN フットプリントとデュアル IQ のフットプリントを比較すると、縦方向と横方向の両方のペナルティが観察できます。前者は DE/MUX とスイッチによって \(L_\mathrm {A}\) が長くなることによるものです。デュアル IQ よりも PPNN の方が優れており、後者は入力バンクや重みバンク内で信号が取り得る 2 つの代替ルートが存在するためです。 2 つのコーナー シナリオに焦点を当てると、(i) \(M_A = M \sim N\) および (ii) \(M_A = 1\) の場合、マルチチャネル動作とプログラマビリティによる横方向のフットプリント ペナルティは、(i) の乗算係数の範囲になります。 \(\sim (1 + 2/N)\) (最良のシナリオ) から (ii) \(M (1 + 1/N) + 1 - 1/N\) (最悪のシナリオ)。 2 番目のケースでは、省電力モードの動作には、PPNN が設計されたチャネルの数に比例したフットプリントのペナルティという代償が伴うことがわかります。

個々のコンポーネントの波長依存性に関する徹底的な研究は、デバイスの温度依存動作や使用されるコンポーネント間の統計的差異を組み込むためにさらに拡張することができます。 温度依存動作は、最大 80 ~ 100\(^\circ\)C のオンチップ温度に遭遇する可能性がある現実的な条件でのパフォーマンスの信頼性に関する有益な情報を提供します。 現在のシリコンフォトニックプラットフォームは同一のデバイスに対して同一の性能を保証しておらず、システム公差解析が必要であるため、使用されているコンポーネント間の統計的差異が考慮される拡張解析は、実用的な観点に関してより明確な洞察を提供するでしょう。 この研究は、偏差補償のための解析式を結論付けることを目的として、異なる振幅と位相方程式によって支配されるさまざまなタイプの入力/重み変調器に拡張することもできます。

システム レベルでは、2 つのアップスケーリングの方向を取ることができます。 1 つは、複数の PPNN の相互接続と、非ランダムな負荷の下での精度を推定するために推論タスクでそれらを使用することに関するものです。 2 つ目は、軸索の数の増加が図 6 で報告されている相対誤差の信頼区間の減少に与えるプラスの影響に依存しています。これは、PPNN アーキテクチャが、我々のアーキテクチャと同様に、二次元配置に確実に拡張できることを示しています。最近提案されたフォトニッククロスバー 31 は、空間的に分離された K 個のニューロン出力を生成します。 WDM によって強化されたクロスバーは、合計 \(K \times M\) 個の論理出力をサポートできると同時に、異なる動作モードを切り替える柔軟性も提供し、フォトニック FPGA コンセプトに近づいています。

この原稿では、波長領域を利用して、柔軟なユーザー定義の相互接続グラフを備えた複数のニューロンの並列動作を実現するための、その場で再構成可能なコヒーレント PNN を紹介します。特に畳み込み層と全結合層を含む 4 つの異なる動作モードをサポートします。 私たちは、変調器と DE/MUX の波長依存性の詳細な分析研究を実行し、バイアス信号の位相調整を通じて PNN 忠実度を復元するための簡単なアプローチを提供し、残留誤差の大部分が DE/MUX のクロストークに起因することを明らかにしました。段階。 この分析アプローチはモンテカルロ シミュレーションに対してベンチマークされ、最大 \(-20 \, \mathrm {dB}\) の AWG クロストークに対して、残留相対誤差が通常、管理可能な 2% の範囲内に留まることが示されています。 さらに重要なのは、バイアス ブランチでの位相調整が実行されている限り、チャネル数やニューロンのファンインが増加しても PNN のパフォーマンスが低下せず、ベクトルのマルチカラム配置への拡張を含むシームレスなネットワーク アップスケーリングをサポートしていることです。 -行列による乗算。 チャネル間隔に対する相対誤差の依存性は弱いため、PNN は粗い WDM システムでも密な WDM システムでも同等に良好に動作できます。

現在の研究中に生成されたデータセット、および/または現在の研究中に分析されたデータセットは、合理的な要求に応じて責任著者から入手できます。

北山 K.-I. 他。 データ処理のためのフォトニクスの新たなフロンティア - フォトニック加速器。 APL フォトニクスhttps://doi.org/10.1063/1.5108912 (2019)。

記事 Google Scholar

De Marinis , L. 、 Cococcioni , M. 、 Castoldi , P. & Andriolli , N. フォトニック ニューラル ネットワーク: 調査。 IEEE アクセス 7、175827 ~ 175841。 https://doi.org/10.1109/ACCESS.2019.2957245 (2019)。

記事 Google Scholar

シャストリ、BJ et al. 人工知能とニューロモーフィック コンピューティングのためのフォトニクス。 ナット。 フォトニクス 15、102–114。 https://doi.org/10.1038/s41566-020-00754-y (2021)。

記事 ADS CAS Google Scholar

フェルドマン、J.ら。 統合されたフォトニック テンソル コアを使用した並列畳み込み処理。 自然 589、52–58。 https://doi.org/10.1038/s41586-020-03070-1 (2021)。

論文 ADS CAS PubMed Google Scholar

Porte, X. et al. 半導体マルチモードレーザー内の完全な並列自律型フォトニックニューラルネットワーク。 J.Phys. フォトニクス。 https://doi.org/10.1088/2515-7647/abf6bd (2021)。

記事 Google Scholar

Totović, AR、Dabos, G.、Passalis, N.、Tefas, A. & Pleros, N. MAC ニューロモーフィック フォトニクスごとのフェムトジュール: エネルギーと技術のロードマップ。 IEEE J. Sel. 上。 量子電子。 26、1-15。 https://doi.org/10.1109/JSTQE.2020.2975579 (2020)。

記事 Google Scholar

マサチューセッツ州ナーミアスら。 ニューラル ネットワークのフォトニック積和演算。 IEEE J. Sel. 上。 量子電子。 26、1–18。 https://doi.org/10.1109/JSTQE.2019.2941485 (2020)。

記事 Google Scholar

Miscuglio, M. & Sorger, VJ 機械学習用のフォトニック テンソル コア。 応用物理学。 改訂版 https://doi.org/10.1063/5.0001942 (2020)。

記事 Google Scholar

Zhang、H.ら。 複素数値ニューラルネットワークを実装するための光学ニューラルチップ。 ナット。 共通。 12、457。https://doi.org/10.1038/s41467-020-20719-7 (2021)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Shen、Y.ら。 コヒーレントなナノフォトニクス回路によるディープラーニング。 ナット。 フォトニクス 11、441–446。 https://doi.org/10.1038/nphoton.2017.93 (2017)。

記事 ADS CAS Google Scholar

Gu、J.ら。 畳み込みニューラル ネットワークの最近の進歩。 パターン認識。 77、354–377。 https://doi.org/10.1016/j.patcog.2017.10.013 (2018)。

記事 ADS Google Scholar

Leijnen, S. & Veen, FV ニューラル ネットワーク動物園。 議事録https://doi.org/10.3390/proceedings2020047009 (2020)。

記事 Google Scholar

Shawahna, A.、Sait, SM & El- Maleh, A. 学習と分類のための深層学習ネットワークの FPGA ベースのアクセラレータ: レビュー。 IEEE アクセス 7、7823 ~ 7859。 https://doi.org/10.1109/ACCESS.2018.2890150 (2019)。

記事 Google Scholar

ボガーツ、W. et al. プログラマブルなフォトニック回路。 自然 586、207–216。 https://doi.org/10.1038/s41586-020-2764-0 (2020)。

論文 ADS CAS PubMed Google Scholar

パイ、S.ら。 任意のフィードフォワード フォトニック ネットワークの並列プログラミング。 IEEE J. Sel. 上。 量子電子。 26、1–13。 https://doi.org/10.1109/JSTQE.2020.2997849 (2020)。

記事 Google Scholar

Huang, C. et al. オンチッププログラマブル非線形光信号プロセッサとそのアプリケーション。 IEEE J. Sel. 上。 量子電子。 27、1-11。 https://doi.org/10.1109/JSTQE.2020.2998073 (2021)。

記事 CAS Google Scholar

Bogaerts, W. & Rahim, A. プログラマブル フォトニクス: アクセス可能な大容量 PIC エコシステムの機会。 IEEE J. Sel. 上。 量子電子。 26、1–17。 https://doi.org/10.1109/JSTQE.2020.2982980 (2020)。

記事 Google Scholar

Fard、MMP et al. 光ニューラルネットワークの任意の活性化関数の実験的実現。 オプション。 エクスプレス 28、12138 ~ 12148。 https://doi.org/10.1364/OE.391473 (2020)。

記事 ADS CAS Google Scholar

Crnjanski, J.、Krstić, M.、Totović, A.、Pleros, N. & Gvozdić, D. 全光学パーセプトロン用の適応シグモイド様および PReLU 活性化関数。 オプション。 レット。 46、2003 ~ 2006 年。 https://doi.org/10.1364/OL.422930 (2021)。

論文 ADS PubMed Google Scholar

Xu、X.ら。 11 個の光ニューラル ネットワーク用のトップ フォトニック畳み込みアクセラレータ。 自然 589、44–51。 https://doi.org/10.1038/s41586-020-03063-0 (2021)。

論文 ADS CAS PubMed Google Scholar

Mourgias-Alexandris, G. et al. デュアル IQ 変調セルを使用したコヒーレント線形ニューロンによるニューロモーフィック フォトニクス。 J.ライトウェーブ・テクノロジー。 38、811–819。 https://doi.org/10.1109/JLT.2019.2949133 (2020)。

記事 ADS CAS Google Scholar

Mourgias-Alexandris, G. et al. 10 GMAC/秒の処理ラインレートを備えたシリコン フォトニック コヒーレント ニューロン。 プロセスで。 光ファイバー通信カンファレンス (OFC) 2021、Tu5H.1 (バーチャルカンファレンス、2021)。

Giamougiannis、G. et al. 32 GMAC/秒/軸索を備えたシリコン統合コヒーレント ニューロンは、EAM ベースの入力セルと重み付けセルを使用してライン レートを計算します。 プロセスで。 欧州光通信会議 (ECOC) 2021 (フランス、ボルドー、2021)。

Passalis, N. et al. 財務時系列分析のためのノイズ耐性のあるリカレント フォトニック ネットワークのトレーニング。 2020 年の第 28 回欧州信号処理会議 (EUSIPCO)、1556 ~ 1560 年、https://doi.org/10.23919/Eusipco47968.2020.9287649 (2021)。

ピトリス、S.ら。 400 Gb/s シリコン フォトニック トランスミッタおよびルーティング WDM テクノロジにより、接着剤不要の 8 ソケットのチップ間相互接続が実現します。 J.ライトウェーブ・テクノロジー。 38、3366–3375。 https://doi.org/10.1109/JLT.2020.2977369 (2020)。

記事 ADS CAS Google Scholar

ジラルディ、G. et al. InPベースのフォトニック集積回路における熱クロストークを低減するための深いトレンチ。 J.ライトウェーブ・テクノロジー。 32、4864–4870。 https://doi.org/10.1109/JLT.2014.2366781 (2014)。

記事 CAS Google Scholar

Krochin-Yepez, P.-A.、Scholz, U. & Zimmermann, A. 位相感応シリコンフォトニックシステムの熱管理のための Cmos 互換の対策。 フォトニクスhttps://doi.org/10.3390/photonics7010006 (2020)。

記事 Google Scholar

Milanizadeh, M.、Aguiar, D.、Melloni, A.、Morichetti, F. フォトニック集積回路における熱クロストーク効果のキャンセル。 J.ライトウェーブ・テクノロジー。 37、1325–1332。 https://doi.org/10.1109/JLT.2019.2892512 (2019)。

記事 ADS CAS Google Scholar

高橋 洋、小田 和也、鳥羽 博、井上 裕一、アレイ導波路 N×N 波長合波器の伝送特性。 J.ライトウェーブ・テクノロジー。 13、447–455。 https://doi.org/10.1109/50.372441 (1995)。

記事 ADS Google Scholar

Li、HH シリコンとゲルマニウムの屈折率とその波長と温度の微分値。 J.Phys. 化学。 参照。 データ 9、561 ~ 658。 https://doi.org/10.1063/1.55​​5624 (1980)。

記事 ADS CAS Google Scholar

Giamougiannis、G. et al. ユニバーサル線形演算子としてのコヒーレントフォトニッククロスバー。 レーザーとフォトニクスのレビュー (2021)。 出版のために提出されました。

リファレンスをダウンロードする

この研究活動は、「教員および研究者を支援するためのHFRI研究プロジェクトの第一次募集および高額研究機器助成金の調達」(DeepLight、プロジェクト番号:4233)の下で、ギリシャ研究イノベーション財団(HFRI)によって部分的に支援されました。 )。

情報学部、学際的研究およびイノベーションセンター - CIRI、アリストテレス大学テッサロニキ、バルカンセンター - Building A、10th Km Thessalonikis-Thermis Av、57001、テッサロニキ、ギリシャ

アンジェリーナ・トトヴィッチ、ジョージ・ジャムージャニス、アポストロス・ツァキリディス、ニコス・プレロス

Celestial AI、3001 Tasman Drive、サンタクララ、CA、95054、米国

デヴィッド・ラゾフスキー

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

著者全員がアイデアを思いつき、ワークフローを設計しました。 AT が数学的分析を実行し、GG と AT がパフォーマンス分析用のコードを展開しました。 著者全員が結果の分析に貢献し、論文を共同執筆しました。

アンジェリーナ・トトヴィッチへの手紙。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Totovic, A.、Giamougiannis, G.、Tsakyridis, A. 他 WDM とコヒーレント線形光学を組み合わせたプログラム可能なフォトニック ニューラル ネットワーク。 Sci Rep 12、5605 (2022)。 https://doi.org/10.1038/s41598-022-09370-y

引用をダウンロード

受信日: 2021 年 9 月 22 日

受理日: 2022 年 3 月 22 日

公開日: 2022 年 4 月 4 日

DOI: https://doi.org/10.1038/s41598-022-09370-y

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。