为了减少传统SIMD多媒体扩展体系存在的数据置换时间开销,该文提出了一种新的多媒体扩展体系。该体系在指令定义中,包含显性的数据置换信息;在实现体系中,融合了计算和数据置换操作。采用H.264的解码程序测试,与基本型的双发射SIMD处理器体系比较表明:整体上可以获得1.4到1.5的加速,而程序代码大小却减少了17.8%。本体系的硬件实现基于TSMC 0.18μm工艺综合显示,增加的数据置换网络只占用了0.66%的芯片面积和0.71ns的延时。