org.ejml.dense.block.TriangularSolver_FDRB Maven / Gradle / Ivy

Go to download
Show more of this group Show more artifacts with this name
Show all versions of ejml-fdense Show documentation
A fast and easy to use dense and sparse matrix linear algebra library written in Java.
There is a newer version: 0.43.1
/*
 * Copyright (c) 2020, Peter Abeles. All Rights Reserved.
 *
 * This file is part of Efficient Java Matrix Library (EJML).
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *   http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package org.ejml.dense.block;

import javax.annotation.Generated;
import org.ejml.data.FGrowArray;
import org.ejml.data.FMatrixRBlock;
import org.ejml.data.FSubmatrixD1;
import org.jetbrains.annotations.Nullable;
import pabeles.concurrency.GrowArray;

import java.util.Arrays;

//CONCURRENT_INLINE import org.ejml.concurrency.EjmlConcurrency;

//CONCURRENT_MACRO MatrixMult_FDRB MatrixMult_MT_FDRB

/**
 * 
 * Contains triangular solvers for {@link FMatrixRBlock} block aligned sub-matrices.
 * 
 *
 * 
 * For a more detailed description of a similar algorithm see:
 * Page 30 in "Fundamentals of Matrix Computations" 2nd Ed. by David S. Watkins
 * or any description of a block triangular solver in any other computational linear algebra book.
 * 
 *
 * @author Peter Abeles
 */
@Generated("org.ejml.dense.block.TriangularSolver_DDRB")
public class TriangularSolver_FDRB {

    /**
     * Inverts an upper or lower triangular block submatrix. Uses a row-oriented approach.
     *
     * @param upper Is it upper or lower triangular.
     * @param T Triangular matrix that is to be inverted. Must be block aligned. Not Modified.
     * @param T_inv Where the inverse is stored. This can be the same as T. Modified.
     * @param workspace Work space variable that is size blockLength*blockLength.
     */
    public static void invert( final int blockLength,
                               final boolean upper,
                               final FSubmatrixD1 T,
                               final FSubmatrixD1 T_inv,
                               @Nullable GrowArray workspace ) {
        if (upper)
            throw new IllegalArgumentException("Upper triangular matrices not supported yet");

        //CONCURRENT_INLINE if (T.original == T_inv.original)
        //CONCURRENT_INLINE    throw new IllegalArgumentException("Same instance not allowed for concurrent");

        if (workspace == null)
            workspace = new GrowArray<>(FGrowArray::new);
        else
            workspace.reset();

        if (T.row0 != T_inv.row0 || T.row1 != T_inv.row1 || T.col0 != T_inv.col0 || T.col1 != T_inv.col1)
            throw new IllegalArgumentException("T and T_inv must be at the same elements in the matrix");

        final int blockSize = blockLength*blockLength;
        //CONCURRENT_REMOVE_BELOW
        float[] temp = workspace.grow().reshape(blockSize).data;

        final int M = T.row1 - T.row0;

        final float[] dataT = T.original.data;
        final float[] dataX = T_inv.original.data;

        final int offsetT = T.row0*T.original.numCols + M*T.col0;

        for (int rowT = 0; rowT < M; rowT += blockLength) {
            final int _rowT = rowT; // Needed for concurrent lambdas
            final int heightT = Math.min(T.row1 - (rowT + T.row0), blockLength);

            final int indexII = offsetT + T.original.numCols*(rowT + T.row0) + heightT*(rowT + T.col0);

            //CONCURRENT_BELOW EjmlConcurrency.loopFor(0, rowT, blockLength, workspace, ( work, colT ) -> {
            for (int colT = 0; colT < rowT; colT += blockLength) {
                //CONCURRENT_INLINE float[] temp = work.reshape(blockSize).data;
                int widthX = Math.min(T.col1 - (colT + T.col0), blockLength);

                Arrays.fill(temp, 0);

                for (int k = colT; k < _rowT; k += blockLength) {
                    int widthT = Math.min(T.col1 - (k + T.col0), blockLength);

                    int indexL = offsetT + T.original.numCols*(_rowT + T.row0) + heightT*(k + T.col0);
                    int indexX = offsetT + T.original.numCols*(k + T.row0) + widthT*(colT + T.col0);

                    InnerMultiplication_FDRB.blockMultMinus(dataT, dataX, temp, indexL, indexX, 0, heightT, widthT, widthX);
                }

                int indexX = offsetT + T.original.numCols*(_rowT + T.row0) + heightT*(colT + T.col0);

                InnerTriangularSolver_FDRB.solveL(dataT, temp, heightT, widthX, heightT, indexII, 0);
                System.arraycopy(temp, 0, dataX, indexX, widthX*heightT);
            }
            //CONCURRENT_ABOVE });
            InnerTriangularSolver_FDRB.invertLower(dataT, dataX, heightT, indexII, indexII);
        }
    }

    //CONCURRENT_OMIT_BEGIN

    /**
     * Inverts an upper or lower triangular block submatrix. Uses a row oriented approach.
     *
     * @param upper Is it upper or lower triangular.
     * @param T Triangular matrix that is to be inverted. Overwritten with solution. Modified.
     * @param workspace Work space variable that is size blockLength*blockLength.
     */
    public static void invert( final int blockLength,
                               final boolean upper,
                               final FSubmatrixD1 T,
                               @Nullable GrowArray workspace ) {
        if (upper)
            throw new IllegalArgumentException("Upper triangular matrices not supported yet");

        if (workspace == null)
            workspace = new GrowArray<>(FGrowArray::new);
        else
            workspace.reset();

        final int blockSize = blockLength*blockLength;
        float[] temp = workspace.grow().reshape(blockSize).data;

        final int M = T.row1 - T.row0;

        final float[] dataT = T.original.data;
        final int offsetT = T.row0*T.original.numCols + M*T.col0;

        for (int i = 0; i < M; i += blockLength) {
            int heightT = Math.min(T.row1 - (i + T.row0), blockLength);

            int indexII = offsetT + T.original.numCols*(i + T.row0) + heightT*(i + T.col0);

            for (int j = 0; j < i; j += blockLength) {
                int widthX = Math.min(T.col1 - (j + T.col0), blockLength);

                Arrays.fill(temp, 0);

                for (int k = j; k < i; k += blockLength) {
                    int widthT = Math.min(T.col1 - (k + T.col0), blockLength);

                    int indexL = offsetT + T.original.numCols*(i + T.row0) + heightT*(k + T.col0);
                    int indexX = offsetT + T.original.numCols*(k + T.row0) + widthT*(j + T.col0);

                    InnerMultiplication_FDRB.blockMultMinus(dataT, dataT, temp, indexL, indexX, 0, heightT, widthT, widthX);
                }

                int indexX = offsetT + T.original.numCols*(i + T.row0) + heightT*(j + T.col0);

                InnerTriangularSolver_FDRB.solveL(dataT, temp, heightT, widthX, heightT, indexII, 0);
                System.arraycopy(temp, 0, dataT, indexX, widthX*heightT);
            }
            InnerTriangularSolver_FDRB.invertLower(dataT, heightT, indexII);
        }
    }
    //CONCURRENT_OMIT_END

    /**
     * 
     * Performs an in-place solve operation on the provided block aligned sub-matrices.

     * 

     * B = T^-1 B

     * 

     * where T is a triangular matrix. T or B can be transposed. T is a square matrix of arbitrary
     * size and B has the same number of rows as T and an arbitrary number of columns.
     * 
     *
     * @param blockLength Size of the inner blocks.
     * @param upper If T is upper or lower triangular.
     * @param T An upper or lower triangular matrix. Not modified.
     * @param B A matrix whose height is the same as T's width. Solution is written here. Modified.
     */
    public static void solve( final int blockLength,
                              final boolean upper,
                              final FSubmatrixD1 T,
                              final FSubmatrixD1 B,
                              final boolean transT ) {

        if (upper) {
            solveR(blockLength, T, B, transT);
        } else {
            solveL(blockLength, T, B, transT);
        }
    }

    /**
     * 
     * Performs an in-place solve operation where T is contained in a single block.

     * 

     * B = T^-1 B

     * 

     * where T is a triangular matrix contained in an inner block. T or B can be transposed. T must be a single complete inner block
     * and B is either a column block vector or row block vector.
     * 
     *
     * @param blockLength Size of the inner blocks in the block matrix.
     * @param upper If T is upper or lower triangular.
     * @param T An upper or lower triangular matrix that is contained in an inner block. Not modified.
     * @param B A block aligned row or column submatrix. Modified.
     * @param transT If T is transposed or not.
     * @param transB If B is transposed or not.
     */
    public static void solveBlock( final int blockLength,
                                   final boolean upper, final FSubmatrixD1 T,
                                   final FSubmatrixD1 B,
                                   final boolean transT, final boolean transB ) {
        int Trows = T.row1 - T.row0;
        if (Trows > blockLength)
            throw new IllegalArgumentException("T can be at most the size of a block");
        // number of rows in a block. The submatrix can be smaller than a block
        final int blockT_rows = Math.min(blockLength, T.original.numRows - T.row0);
        final int blockT_cols = Math.min(blockLength, T.original.numCols - T.col0);

        int offsetT = T.row0*T.original.numCols + blockT_rows*T.col0;

        final float[] dataT = T.original.data;
        final float[] dataB = B.original.data;

        if (transB) {
            if (upper) {
                if (transT) {
                    throw new IllegalArgumentException("Operation not yet supported");
                } else {
                    throw new IllegalArgumentException("Operation not yet supported");
                }
            } else {
                if (transT) {
                    throw new IllegalArgumentException("Operation not yet supported");
                } else {
                    //CONCURRENT_BELOW EjmlConcurrency.loopFor(B.row0, B.row1, blockLength, i -> {
                    for (int i = B.row0; i < B.row1; i += blockLength) {
                        int N = Math.min(B.row1, i + blockLength) - i;

                        int offsetB = i*B.original.numCols + N*B.col0;

                        InnerTriangularSolver_FDRB.solveLTransB(dataT, dataB, blockT_rows, N, blockT_rows, offsetT, offsetB);
                    }
                    //CONCURRENT_ABOVE });
                }
            }
        } else {
            if (Trows != B.row1 - B.row0)
                throw new IllegalArgumentException("T and B must have the same number of rows.");

            if (upper) {
                if (transT) {
                    //CONCURRENT_BELOW EjmlConcurrency.loopFor(B.col0, B.col1, blockLength, i -> {
                    for (int i = B.col0; i < B.col1; i += blockLength) {
                        int offsetB = B.row0*B.original.numCols + Trows*i;

                        int N = Math.min(B.col1, i + blockLength) - i;
                        InnerTriangularSolver_FDRB.solveTransU(dataT, dataB, Trows, N, Trows, offsetT, offsetB);
                    }
                    //CONCURRENT_ABOVE });
                } else {
                    //CONCURRENT_BELOW EjmlConcurrency.loopFor(B.col0, B.col1, blockLength, i -> {
                    for (int i = B.col0; i < B.col1; i += blockLength) {
                        int offsetB = B.row0*B.original.numCols + Trows*i;

                        int N = Math.min(B.col1, i + blockLength) - i;
                        InnerTriangularSolver_FDRB.solveU(dataT, dataB, Trows, N, Trows, offsetT, offsetB);
                    }
                    //CONCURRENT_ABOVE });
                }
            } else {
                if (transT) {
                    //CONCURRENT_BELOW EjmlConcurrency.loopFor(B.col0, B.col1, blockLength, i -> {
                    for (int i = B.col0; i < B.col1; i += blockLength) {
                        int offsetB = B.row0*B.original.numCols + Trows*i;

                        int N = Math.min(B.col1, i + blockLength) - i;
                        InnerTriangularSolver_FDRB.solveTransL(dataT, dataB, Trows, N, blockT_cols, offsetT, offsetB);
                    }
                    //CONCURRENT_ABOVE });
                } else {
                    //CONCURRENT_BELOW EjmlConcurrency.loopFor(B.col0, B.col1, blockLength, i -> {
                    for (int i = B.col0; i < B.col1; i += blockLength) {
                        int offsetB = B.row0*B.original.numCols + Trows*i;

                        int N = Math.min(B.col1, i + blockLength) - i;
                        InnerTriangularSolver_FDRB.solveL(dataT, dataB, Trows, N, blockT_cols, offsetT, offsetB);
                    }
                    //CONCURRENT_ABOVE });
                }
            }
        }
    }

    /**
     * 
     * Solves lower triangular systems:

     * 

     * B = L^-1 B

     * 

     * 
     *
     *  Reverse or forward substitution is used depending upon L being transposed or not. 
     *
     * @param L Lower triangular with dimensions m by m. Not modified.
     * @param B A matrix with dimensions m by n. Solution is written into here. Modified.
     * @param transL Is the triangular matrix transposed?
     */
    public static void solveL( final int blockLength,
                               final FSubmatrixD1 L,
                               final FSubmatrixD1 B,
                               boolean transL ) {

        FSubmatrixD1 Y = new FSubmatrixD1(B.original);

        FSubmatrixD1 Linner = new FSubmatrixD1(L.original);
        FSubmatrixD1 Binner = new FSubmatrixD1(B.original);

        int lengthL = B.row1 - B.row0;

        int startI, stepI;

        if (transL) {
            startI = lengthL - lengthL%blockLength;
            if (startI == lengthL && lengthL >= blockLength)
                startI -= blockLength;

            stepI = -blockLength;
        } else {
            startI = 0;
            stepI = blockLength;
        }

        for (int i = startI; ; i += stepI) {
            if (transL) {
                if (i < 0) break;
            } else {
                if (i >= lengthL) break;
            }

            // width and height of the inner T(i,i) block
            int widthT = Math.min(blockLength, lengthL - i);

            Linner.col0 = L.col0 + i;
            Linner.col1 = Linner.col0 + widthT;
            Linner.row0 = L.row0 + i;
            Linner.row1 = Linner.row0 + widthT;

            Binner.col0 = B.col0;
            Binner.col1 = B.col1;
            Binner.row0 = B.row0 + i;
            Binner.row1 = Binner.row0 + widthT;

            // solve the top row block
            // B(i,:) = T(i,i)^-1 Y(i,:)
            solveBlock(blockLength, false, Linner, Binner, transL, false);

            boolean updateY;
            if (transL) {
                updateY = Linner.row0 > 0;
            } else {
                updateY = Linner.row1 < L.row1;
            }
            if (updateY) {
                // Y[i,:] = Y[i,:] - sum j=1:i-1 { T[i,j] B[j,i] }
                // where i is the next block down
                // The summation is a block inner product
                if (transL) {
                    Linner.col1 = Linner.col0;
                    Linner.col0 = Linner.col1 - blockLength;
                    Linner.row1 = L.row1;
                    //Tinner.col1 = Tinner.col1;

//                    Binner.row0 = Binner.row0;
                    Binner.row1 = B.row1;

                    Y.row0 = Binner.row0 - blockLength;
                    Y.row1 = Binner.row0;
                } else {
                    Linner.row0 = Linner.row1;
                    Linner.row1 = Math.min(Linner.row0 + blockLength, L.row1);
                    Linner.col0 = L.col0;
                    //Tinner.col1 = Tinner.col1;

                    Binner.row0 = B.row0;
                    //Binner.row1 = Binner.row1;

                    Y.row0 = Binner.row1;
                    Y.row1 = Math.min(Y.row0 + blockLength, B.row1);
                }

                // step through each block column
                for (int k = B.col0; k < B.col1; k += blockLength) {

                    Binner.col0 = k;
                    Binner.col1 = Math.min(k + blockLength, B.col1);

                    Y.col0 = Binner.col0;
                    Y.col1 = Binner.col1;

                    if (transL) {
                        // Y = Y - T^T * B
                        MatrixMult_FDRB.multMinusTransA(blockLength, Linner, Binner, Y);
                    } else {

                        // Y = Y - T * B
                        MatrixMult_FDRB.multMinus(blockLength, Linner, Binner, Y);
                    }
                }
            }
        }
    }

    /**
     * 
     * Solves upper triangular systems:

     * 

     * B = R^-1 B

     * 

     * 
     *
     * Only the first B.numRows rows in R will be processed. Lower triangular elements are ignored.

     *
     * 
 Reverse or forward substitution is used depending upon L being transposed or not. 
     *
     * @param R Upper triangular with dimensions m by m. Not modified.
     * @param B A matrix with dimensions m by n. Solution is written into here. Modified.
     * @param transR Is the triangular matrix transposed?
     */
    public static void solveR( final int blockLength,
                               final FSubmatrixD1 R,
                               final FSubmatrixD1 B,
                               boolean transR ) {

        int lengthR = B.row1 - B.row0;
        if (R.getCols() != lengthR) {
            throw new IllegalArgumentException("Number of columns in R must be equal to the number of rows in B");
        } else if (R.getRows() != lengthR) {
            throw new IllegalArgumentException("Number of rows in R must be equal to the number of rows in B");
        }

        FSubmatrixD1 Y = new FSubmatrixD1(B.original);

        FSubmatrixD1 Rinner = new FSubmatrixD1(R.original);
        FSubmatrixD1 Binner = new FSubmatrixD1(B.original);

        int startI, stepI;

        if (transR) {
            startI = 0;
            stepI = blockLength;
        } else {
            startI = lengthR - lengthR%blockLength;
            if (startI == lengthR && lengthR >= blockLength)
                startI -= blockLength;

            stepI = -blockLength;
        }

        for (int i = startI; ; i += stepI) {
            if (transR) {
                if (i >= lengthR) break;
            } else {
                if (i < 0) break;
            }

            // width and height of the inner T(i,i) block
            int widthT = Math.min(blockLength, lengthR - i);

            Rinner.col0 = R.col0 + i;
            Rinner.col1 = Rinner.col0 + widthT;
            Rinner.row0 = R.row0 + i;
            Rinner.row1 = Rinner.row0 + widthT;

            Binner.col0 = B.col0;
            Binner.col1 = B.col1;
            Binner.row0 = B.row0 + i;
            Binner.row1 = Binner.row0 + widthT;

            // solve the top row block
            // B(i,:) = T(i,i)^-1 Y(i,:)
            solveBlock(blockLength, true, Rinner, Binner, transR, false);

            boolean updateY;
            if (transR) {
                updateY = Rinner.row1 < R.row1;
            } else {
                updateY = Rinner.row0 > 0;
            }
            if (updateY) {
                // Y[i,:] = Y[i,:] - sum j=1:i-1 { T[i,j] B[j,i] }
                // where i is the next block down
                // The summation is a block inner product
                if (transR) {
                    Rinner.col0 = Rinner.col1;
                    Rinner.col1 = Math.min(Rinner.col0 + blockLength, R.col1);
                    Rinner.row0 = R.row0;
                    //Rinner.row1 = Rinner.row1;

                    Binner.row0 = B.row0;
                    //Binner.row1 = Binner.row1;

                    Y.row0 = Binner.row1;
                    Y.row1 = Math.min(Y.row0 + blockLength, B.row1);
                } else {
                    Rinner.row1 = Rinner.row0;
                    Rinner.row0 = Rinner.row1 - blockLength;
                    Rinner.col1 = R.col1;

//                    Binner.row0 = Binner.row0;
                    Binner.row1 = B.row1;

                    Y.row0 = Binner.row0 - blockLength;
                    Y.row1 = Binner.row0;
                }

                // step through each block column
                for (int k = B.col0; k < B.col1; k += blockLength) {

                    Binner.col0 = k;
                    Binner.col1 = Math.min(k + blockLength, B.col1);

                    Y.col0 = Binner.col0;
                    Y.col1 = Binner.col1;

                    if (transR) {
                        // Y = Y - T^T * B
                        MatrixMult_FDRB.multMinusTransA(blockLength, Rinner, Binner, Y);
                    } else {
                        // Y = Y - T * B
                        MatrixMult_FDRB.multMinus(blockLength, Rinner, Binner, Y);
                    }
                }
            }
        }
    }
}