arTransmatの構造を書き換えて徹底的に最適化したところ、演算結果はそのままに、オリジナル(O2コンパイル版)比115%程度の性能を達成。
変換行列計算に限っては、オリジナルより早くなりました。
画処理系の最適化がまだ不十分だけど、全体でもネイティブの1.5倍程度の
性能劣化でおさまるようになった。
もう一箇所、画処理関係の最適化が終わったら、ぼちぼちリリースしようかなと…。
ネコと和解せよ
arTransmatの構造を書き換えて徹底的に最適化したところ、演算結果はそのままに、オリジナル(O2コンパイル版)比115%程度の性能を達成。
変換行列計算に限っては、オリジナルより早くなりました。
画処理系の最適化がまだ不十分だけど、全体でもネイティブの1.5倍程度の
性能劣化でおさまるようになった。
もう一箇所、画処理関係の最適化が終わったら、ぼちぼちリリースしようかなと…。