LLMへの長時間映像の取り込みではフレームを間引く形になり、情報が欠落し、回答精度が低くなる。コンテキスト記憶では選択的注意による特徴量圧縮を行い、記憶主題に対する情報が欠落しない

LLMへの長時間映像の取り込みではフレームを間引く形になり、情報が欠落し、回答精度が低くなる。コンテキスト記憶では選択的注意による特徴量圧縮を行い、記憶主題に対する情報が欠落しない