而我自己私底下卻在思考說這些負載很重的演算法的特化手法, 像 latency 要求要更低的 resize, smoothing (gaussian smoothing), gaussian background model, morphological 這些, 有些用軟體 SIMD 改寫 (因為那顆 DSP 是 VLIW 機器, 是沒有什麼 SIMD 可用的..), 為了 SIMD 還要做些資料結構上的改寫.. 有些算法做點簡化, 像 GMM 只做 3 組 sample, 不做 5 甚至 7 組. 這樣東湊西湊, turn 到原本將近四倍的 performance... 這樣 turn 原本的想法是要在 pc 上跑, 因為平臺是 atom 那種東西.. 後來覺的 pc 上跑的還不錯, 就嘗試移植到 ARM 上, 因為做監控用途的那隻 camera 是一顆 ARM 的 SoC...
其實, 原本這樣做只是打算做一個玩具, 但沒想到後來因為 DSP 卡難產, 這個玩具最後花了大約一個月時間 fine-turn 到可以對專案交差的程度...
平心而論, 這種研究原本不是我工作範圍內該做的, 變成今天這種結果, 這樣的工作是應該還是不應該, 我實在不知道....