Haswell 2.6GHz, FMA, GCC6

C += A · B   (gemm)
C += A · B   (gemm lazy)
y += A · x   (gemv)
y += AT · x   (gemv)
y += U · x   (trmv)
y += UT · x   (trmv)
y += L · x   (trmv)
y += LT · x   (trmv)
L · LT = A   (Cholesky,potrf)