Skylake 3.3GHz, AVX512, clang-7

C += A · B   (gemm)
C += A · B   (gemm lazy)
y += A · x   (gemv)
y += AT · x   (gemv)
y += U · x   (trmv)
y += UT · x   (trmv)
y += L · x   (trmv)
y += LT · x   (trmv)
L · LT = A   (Cholesky,potrf)