SIMD 支持

VecElement{T} 类型是为了构建 SIMD 运算符的库。实际使用中要求使用 llvmcall。类型按下文定义:

struct VecElement{T}
    value::T
end

It has a special compilation rule: a homogeneous tuple of VecElement{T} maps to an LLVM vector type when T is a primitive bits type.

使用 -O3 参数时,编译器 可能 自动为这样的元组向量化运算符。 例如接下来的程序,使用 julia -O3 编译,在x86系统中会生成两个 SIMD 附加指令(addps):

const m128 = NTuple{4,VecElement{Float32}}

function add(a::m128, b::m128)
    (VecElement(a[1].value+b[1].value),
     VecElement(a[2].value+b[2].value),
     VecElement(a[3].value+b[3].value),
     VecElement(a[4].value+b[4].value))
end

triple(c::m128) = add(add(c,c),c)

code_native(triple,(m128,))

然而,因为无法依靠自动向量化,以后将主要通过使用基于 llvmcall 的库来提供 SIMD 支持。