org.arbiter.deeplearning4j.BaseNetworkSpace Maven / Gradle / Ivy

Go to download
Show more of this group Show more artifacts with this name
Show all versions of arbiter-deeplearning4j Show documentation
There is a newer version: 1.0.0-beta3
Show newest version
/*
 *  * Copyright 2016 Skymind,Inc.
 *  *
 *  *    Licensed under the Apache License, Version 2.0 (the "License");
 *  *    you may not use this file except in compliance with the License.
 *  *    You may obtain a copy of the License at
 *  *
 *  *        http://www.apache.org/licenses/LICENSE-2.0
 *  *
 *  *    Unless required by applicable law or agreed to in writing, software
 *  *    distributed under the License is distributed on an "AS IS" BASIS,
 *  *    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 *  *    See the License for the specific language governing permissions and
 *  *    limitations under the License.
 */

package org.arbiter.deeplearning4j;

import lombok.AllArgsConstructor;
import org.arbiter.deeplearning4j.layers.LayerSpace;
import org.arbiter.optimize.parameter.FixedValue;
import org.arbiter.optimize.api.ParameterSpace;
import org.deeplearning4j.earlystopping.EarlyStoppingConfiguration;
import org.deeplearning4j.nn.api.OptimizationAlgorithm;
import org.deeplearning4j.nn.conf.*;
import org.deeplearning4j.nn.conf.distribution.Distribution;
import org.deeplearning4j.nn.weights.WeightInit;

import java.util.ArrayList;
import java.util.List;
import java.util.Map;

//public class MultiLayerSpace implements ModelParameterSpace {
public abstract class BaseNetworkSpace implements ParameterSpace {

    protected ParameterSpace useDropConnect;
    protected ParameterSpace iterations;
    protected Long seed;
    protected ParameterSpace optimizationAlgo;
    protected ParameterSpace regularization;
    protected ParameterSpace schedules;
    protected ParameterSpace activationFunction;
    protected ParameterSpace weightInit;
    protected ParameterSpace dist;
    protected ParameterSpace learningRate;
    protected ParameterSpace> learningRateAfter;
    protected ParameterSpace lrScoreBasedDecay;
    protected ParameterSpace l1;
    protected ParameterSpace l2;
    protected ParameterSpace dropOut;
    protected ParameterSpace momentum;
    protected ParameterSpace> momentumAfter;
    protected ParameterSpace updater;
    protected ParameterSpace rho;
    protected ParameterSpace rmsDecay;
    protected ParameterSpace gradientNormalization;
    protected ParameterSpace gradientNormalizationThreshold;
    protected ParameterSpace cnnInputSize;

    protected List layerSpaces = new ArrayList<>();

    //NeuralNetConfiguration.ListBuilder/MultiLayerConfiguration.Builder options:
    protected ParameterSpace backprop;
    protected ParameterSpace pretrain;
    protected ParameterSpace backpropType;
    protected ParameterSpace tbpttFwdLength;
    protected ParameterSpace tbpttBwdLength;

    protected int numEpochs = 1;

    @SuppressWarnings("unchecked")
    protected BaseNetworkSpace(Builder builder){
        this.useDropConnect = builder.useDropConnect;
        this.iterations = builder.iterations;
        this.seed = builder.seed;
        this.optimizationAlgo = builder.optimizationAlgo;
        this.regularization = builder.regularization;
        this.schedules = builder.schedules;
        this.activationFunction = builder.activationFunction;
        this.weightInit = builder.weightInit;
        this.dist = builder.dist;
        this.learningRate = builder.learningRate;
        this.learningRateAfter = builder.learningRateAfter;
        this.lrScoreBasedDecay = builder.lrScoreBasedDecay;
        this.l1 = builder.l1;
        this.l2 = builder.l2;
        this.dropOut = builder.dropOut;
        this.momentum = builder.momentum;
        this.momentumAfter = builder.momentumAfter;
        this.updater = builder.updater;
        this.rho = builder.rho;
        this.rmsDecay = builder.rmsDecay;
        this.gradientNormalization = builder.gradientNormalization;
        this.gradientNormalizationThreshold = builder.gradientNormalizationThreshold;

        this.backprop = builder.backprop;
        this.pretrain = builder.pretrain;
        this.backpropType = builder.backpropType;
        this.tbpttFwdLength = builder.tbpttFwdLength;
        this.tbpttBwdLength = builder.tbpttBwdLength;
        this.cnnInputSize = builder.cnnInputSize;

        this.numEpochs = builder.numEpochs;
    }


    protected NeuralNetConfiguration.Builder randomGlobalConf(double[] values){
        //Create MultiLayerConfiguration...
        NeuralNetConfiguration.Builder builder = new NeuralNetConfiguration.Builder();
        if(useDropConnect != null) builder.useDropConnect(useDropConnect.getValue(values));
        if(iterations != null) builder.iterations(iterations.getValue(values));
        if(seed != null) builder.seed(seed);
        if(optimizationAlgo != null) builder.optimizationAlgo(optimizationAlgo.getValue(values));
        if(regularization != null) builder.regularization(regularization.getValue(values));
       // if(schedules != null) builder.learningRateSchedule(schedules.getValue(values));
        if(activationFunction != null) builder.activation(activationFunction.getValue(values));
        if(weightInit != null) builder.weightInit(weightInit.getValue(values));
        if(dist != null) builder.dist(dist.getValue(values));
        if(learningRate != null) builder.learningRate(learningRate.getValue(values));
        if(learningRateAfter != null) builder.learningRateSchedule(learningRateAfter.getValue(values));
        if(lrScoreBasedDecay != null) builder.learningRateScoreBasedDecayRate(lrScoreBasedDecay.getValue(values));
        if(l1 != null) builder.l1(l1.getValue(values));
        if(l2 != null) builder.l2(l2.getValue(values));
        if(dropOut != null) builder.dropOut(dropOut.getValue(values));
        if(momentum != null) builder.momentum(momentum.getValue(values));
        if(momentumAfter != null) builder.momentumAfter(momentumAfter.getValue(values));
        if(updater != null) builder.updater(updater.getValue(values));
        if(rho != null) builder.rho(rho.getValue(values));
        if(rmsDecay != null) builder.rmsDecay(rmsDecay.getValue(values));
        if(gradientNormalization != null) builder.gradientNormalization(gradientNormalization.getValue(values));
        if(gradientNormalizationThreshold != null) builder.gradientNormalizationThreshold(gradientNormalizationThreshold.getValue(values));

        return builder;
    }

    @Override
    public List collectLeaves(){
        List list = new ArrayList<>();
        if(useDropConnect != null) list.addAll(useDropConnect.collectLeaves());
        if(iterations != null) list.addAll(iterations.collectLeaves());
        if(optimizationAlgo != null) list.addAll(optimizationAlgo.collectLeaves());
        if(regularization != null) list.addAll(regularization.collectLeaves());
        if(schedules != null) list.addAll(schedules.collectLeaves());
        if(activationFunction != null) list.addAll(activationFunction.collectLeaves());
        if(weightInit != null) list.addAll(weightInit.collectLeaves());
        if(dist != null) list.addAll(dist.collectLeaves());
        if(learningRate != null) list.addAll(learningRate.collectLeaves());
        if(learningRateAfter != null) list.addAll(learningRateAfter.collectLeaves());
        if(lrScoreBasedDecay != null) list.addAll(lrScoreBasedDecay.collectLeaves());
        if(l1 != null) list.addAll(l1.collectLeaves());
        if(l2 != null) list.addAll(l2.collectLeaves());
        if(dropOut != null) list.addAll(dropOut.collectLeaves());
        if(momentum != null) list.addAll(momentum.collectLeaves());
        if(momentumAfter != null) list.addAll(momentumAfter.collectLeaves());
        if(updater != null) list.addAll(updater.collectLeaves());
        if(rho != null) list.addAll(rho.collectLeaves());
        if(rmsDecay != null) list.addAll(rmsDecay.collectLeaves());
        if(gradientNormalization != null) list.addAll(gradientNormalization.collectLeaves());
        if(gradientNormalizationThreshold != null) list.addAll(gradientNormalizationThreshold.collectLeaves());
        if(cnnInputSize != null) list.addAll(cnnInputSize.collectLeaves());
        return list;
    }


    @Override
    public boolean isLeaf() {
        return false;
    }

    @Override
    public void setIndices(int... indices) {
        throw new UnsupportedOperationException("Cannot set indices for non leaf");
    }

    @Override
    public String toString(){
        StringBuilder sb = new StringBuilder();
        if(useDropConnect != null) sb.append("useDropConnect: ").append(useDropConnect).append("\n");
        if(iterations != null) sb.append("iterations: ").append(iterations).append("\n");
        if(seed != null) sb.append("seed: ").append(seed).append("\n");
        if(optimizationAlgo != null) sb.append("optimizationAlgo: ").append(optimizationAlgo).append("\n");
        if(regularization != null) sb.append("regularization: ").append(regularization).append("\n");
        if(schedules != null) sb.append("schedules: ").append(schedules).append("\n");
        if(activationFunction != null) sb.append("activationFunction: ").append(activationFunction).append("\n");
        if(weightInit != null) sb.append("weightInit: ").append(weightInit).append("\n");
        if(dist != null) sb.append("dist: ").append(dist).append("\n");
        if(learningRate != null) sb.append("learningRate: ").append(learningRate).append("\n");
        if(learningRateAfter != null) sb.append("learningRateAfter: ").append(learningRateAfter).append("\n");
        if(lrScoreBasedDecay != null) sb.append("lrScoreBasedDecay: ").append(lrScoreBasedDecay).append("\n");
        if(l1 != null) sb.append("l1: ").append(l1).append("\n");
        if(l2 != null) sb.append("l2: ").append(l2).append("\n");
        if(dropOut != null) sb.append("dropOut: ").append(dropOut).append("\n");
        if(momentum != null) sb.append("momentum: ").append(momentum).append("\n");
        if(momentumAfter != null) sb.append("momentumAfter: ").append(momentumAfter).append("\n");
        if(updater != null) sb.append("updater: ").append(updater).append("\n");
        if(rho != null) sb.append("rho: ").append(rho).append("\n");
        if(rmsDecay != null) sb.append("rmsDecay: ").append(rmsDecay).append("\n");
        if(gradientNormalization != null) sb.append("gradientNormalization: ").append(gradientNormalization).append("\n");
        if(gradientNormalizationThreshold != null) sb.append("gradientNormalizationThreshold: ").append(gradientNormalizationThreshold).append("\n");
        if(backprop != null) sb.append("backprop: ").append(backprop).append("\n");
        if(pretrain != null) sb.append("pretrain: ").append(pretrain).append("\n");
        if(backpropType != null) sb.append("backpropType: ").append(backpropType).append("\n");
        if(tbpttFwdLength != null) sb.append("tbpttFwdLength: ").append(tbpttFwdLength).append("\n");
        if(tbpttBwdLength != null) sb.append("tbpttBwdLength: ").append(tbpttBwdLength).append("\n");
        if(cnnInputSize != null) sb.append("cnnInputSize: ").append(cnnInputSize).append("\n");

        int i=0;
        for(LayerConf conf : layerSpaces){

            sb.append("Layer config ").append(i++).append(": (Number layers:").append(conf.numLayers)
                    .append(", duplicate: ").append(conf.duplicateConfig).append("), ")
                    .append(conf.layerSpace.toString()).append("\n");
        }


        return sb.toString();
    }

    @AllArgsConstructor
    private static class LayerConf {
        private final LayerSpace layerSpace;
        private final ParameterSpace numLayers;
        private final boolean duplicateConfig;

    }

    @SuppressWarnings("unchecked")
    protected abstract static class Builder> {

        private ParameterSpace useDropConnect;
        private ParameterSpace iterations;
        private Long seed;
        private ParameterSpace optimizationAlgo;
        private ParameterSpace regularization;
        private ParameterSpace schedules;
        private ParameterSpace activationFunction;
        private ParameterSpace weightInit;
        private ParameterSpace dist;
        private ParameterSpace learningRate;
        private ParameterSpace> learningRateAfter;
        private ParameterSpace lrScoreBasedDecay;
        private ParameterSpace l1;
        private ParameterSpace l2;
        private ParameterSpace dropOut;
        private ParameterSpace momentum;
        private ParameterSpace> momentumAfter;
        private ParameterSpace updater;
        private ParameterSpace rho;
        private ParameterSpace rmsDecay;
        private ParameterSpace gradientNormalization;
        private ParameterSpace gradientNormalizationThreshold;
        private ParameterSpace cnnInputSize;

        //NeuralNetConfiguration.ListBuilder/MultiLayerConfiguration.Builder options:
        private ParameterSpace backprop;
        private ParameterSpace pretrain;
        private ParameterSpace backpropType;
        private ParameterSpace tbpttFwdLength;
        private ParameterSpace tbpttBwdLength;

        //Early stopping configuration / (fixed) number of epochs:
        private EarlyStoppingConfiguration earlyStoppingConfiguration;
        private int numEpochs = 1;


        public T useDropConnect(boolean useDropConnect){
            return useDropConnect(new FixedValue<>(useDropConnect));
        }

        public T useDropConnect(ParameterSpace parameterSpace){
            this.useDropConnect = parameterSpace;
            return (T)this;
        }

        public T iterations(int iterations){
            return iterations(new FixedValue<>(iterations));
        }

        public T iterations(ParameterSpace parameterSpace){
            this.iterations = parameterSpace;
            return (T)this;
        }

        public T seed(long seed){
            this.seed = seed;
            return (T)this;
        }

        public T optimizationAlgo(OptimizationAlgorithm optimizationAlgorithm){
            return optimizationAlgo(new FixedValue<>(optimizationAlgorithm));
        }

        public T optimizationAlgo(ParameterSpace parameterSpace){
            this.optimizationAlgo = parameterSpace;
            return (T)this;
        }

        public T regularization(boolean useRegularization){
            return regularization(new FixedValue<>(useRegularization));
        }

        public T regularization(ParameterSpace parameterSpace){
            this.regularization = parameterSpace;
            return (T)this;
        }

        public T schedules(boolean schedules){
            return schedules(new FixedValue<>(schedules));
        }

        public T schedules(ParameterSpace schedules){
            this.schedules = schedules;
            return (T)this;
        }

        public T activation(String activationFunction){
            return activation(new FixedValue<>(activationFunction));
        }

        public T activation(ParameterSpace activationFunction){
            this.activationFunction = activationFunction;
            return (T)this;
        }

        public T weightInit(WeightInit weightInit){
            return weightInit(new FixedValue<>(weightInit));
        }

        public T weightInit(ParameterSpace weightInit){
            this.weightInit = weightInit;
            return (T)this;
        }

        public T dist(Distribution dist){
            return dist(new FixedValue<>(dist));
        }

        public T dist(ParameterSpace dist){
            this.dist = dist;
            return (T)this;
        }

        public T learningRate(double learningRate){
            return learningRate(new FixedValue<>(learningRate));
        }

        public T learningRate(ParameterSpace learningRate){
            this.learningRate = learningRate;
            return (T)this;
        }

        public T learningRateAfter(Map learningRateAfter){
            return learningRateAfter(new FixedValue<>(learningRateAfter));
        }

        public T learningRateAfter(ParameterSpace> learningRateAfter ){
            this.learningRateAfter = learningRateAfter;
            return (T)this;
        }

        public T learningRateScoreBasedDecayRate(double lrScoreBasedDecay){
            return learningRateScoreBasedDecayRate(new FixedValue<>(lrScoreBasedDecay));
        }

        public T learningRateScoreBasedDecayRate(ParameterSpace lrScoreBasedDecay){
            this.lrScoreBasedDecay = lrScoreBasedDecay;
            return (T)this;
        }

        public T l1(double l1){
            return l1(new FixedValue<>(l1));
        }

        public T l1(ParameterSpace l1){
            this.l1 = l1;
            return (T)this;
        }

        public T l2(double l2){
            return l2(new FixedValue<>(l2));
        }

        public T l2(ParameterSpace l2){
            this.l2 = l2;
            return (T)this;
        }

        public T dropOut(double dropOut){
            return dropOut(new FixedValue<>(dropOut));
        }

        public T dropOut(ParameterSpace dropOut){
            this.dropOut = dropOut;
            return (T)this;
        }

        public T momentum(double momentum){
            return momentum(new FixedValue<>(momentum));
        }

        public T momentum(ParameterSpace momentum){
            this.momentum = momentum;
            return (T)this;
        }

        public T momentumAfter(Map momentumAfter){
            return momentumAfter(new FixedValue<>(momentumAfter));
        }

        public T momentumAfter(ParameterSpace> momentumAfter){
            this.momentumAfter = momentumAfter;
            return (T)this;
        }

        public T updater(Updater updater){
            return updater(new FixedValue<>(updater));
        }

        public T updater(ParameterSpace updater){
            this.updater = updater;
            return (T)this;
        }

        public T rho(double rho){
            return rho(new FixedValue<>(rho));
        }

        public T rho(ParameterSpace rho){
            this.rho = rho;
            return (T)this;
        }

        public T rmsDecay(double rmsDecay){
            return rmsDecay(new FixedValue<>(rmsDecay));
        }

        public T rmsDecay(ParameterSpace rmsDecay){
            this.rmsDecay = rmsDecay;
            return (T)this;
        }

        public T gradientNormalization(GradientNormalization gradientNormalization){
            return gradientNormalization(new FixedValue<>(gradientNormalization));
        }

        public T gradientNormalization(ParameterSpace gradientNormalization){
            this.gradientNormalization = gradientNormalization;
            return (T)this;
        }

        public T gradientNormalizationThreshold(double threshold){
            return gradientNormalizationThreshold(new FixedValue<>(threshold));
        }

        public T gradientNormalizationThreshold(ParameterSpace gradientNormalizationThreshold){
            this.gradientNormalizationThreshold = gradientNormalizationThreshold;
            return (T)this;
        }

        public T backprop(boolean backprop){
            return backprop(new FixedValue<>(backprop));
        }

        public T backprop(ParameterSpace backprop){
            this.backprop = backprop;
            return (T)this;
        }

        public T pretrain(boolean pretrain){
            return pretrain(new FixedValue<>(pretrain));
        }

        public T pretrain(ParameterSpace pretrain){
            this.pretrain = pretrain;
            return (T)this;
        }

        public T backpropType(BackpropType backpropType){
            return backpropType(new FixedValue<>(backpropType));
        }

        public T backpropType(ParameterSpace backpropType){
            this.backpropType = backpropType;
            return (T)this;
        }

        public T tbpttFwdLength(int tbpttFwdLength){
            return tbpttFwdLength(new FixedValue<>(tbpttFwdLength));
        }

        public T tbpttFwdLength(ParameterSpace tbpttFwdLength){
            this.tbpttFwdLength = tbpttFwdLength;
            return (T)this;
        }

        public T tbpttBwdLength(int tbpttBwdLength){
            return tbpttBwdLength(new FixedValue<>(tbpttBwdLength));
        }

        public T tbpttBwdLength(ParameterSpace tbpttBwdLength){
            this.tbpttBwdLength = tbpttBwdLength;
            return (T)this;
        }

        /** Fixed number of training epochs. Default: 1
         * Note if both EarlyStoppingConfiguration and number of epochs is present, early stopping will be used in preference.
         */
        public T numEpochs(int numEpochs){
            this.numEpochs = numEpochs;
            return (T)this;
        }

        public abstract  E build();
    }

}