io.nosqlbench.nb.api.content.NBIO Maven / Gradle / Ivy

Go to download
package io.nosqlbench.nb.api.content;

import io.nosqlbench.nb.api.errors.BasicError;
import org.apache.commons.csv.CSVFormat;
import org.apache.commons.csv.CSVParser;

import java.io.IOException;
import java.io.InputStream;
import java.io.Reader;
import java.nio.CharBuffer;
import java.nio.file.FileSystems;
import java.nio.file.Path;
import java.util.*;
import java.util.stream.Collectors;

/**
 * NBIO is a helper utility packaged as a search builder and fluent API.
 * It uses value semantics internally, so it is safe to re-use as a
 * stateful configuration builder for finding files in various ways.
 * 
 * Since this is meant to ease development around a usually over-complicated
 * surface area in the JVM (Files, Paths, URIs, accessing data, knowing where it comes
 * from, searching for it, etc), more emphasis was put on ease of use and
 * clarity than efficiency. This set of classes is not expected to be used
 * much in NoSqlBench after initialization.
 */
public class NBIO implements NBPathsAPI.Facets {

    private URIResolver resolver;

    private List names = new ArrayList<>();
    private List extensions = new ArrayList<>();
    private List prefixes = new ArrayList<>();

    private NBIO() {
    }

    private NBIO(URIResolver resolver,
                 List prefixes,
                 List names,
                 List extensions) {
        this.resolver = resolver;
        this.prefixes = prefixes;
        this.names = names;
        this.extensions = extensions;
    }

    public static List readLines(String filename) {
        Content data = NBIO.all().prefix("data").name(filename).first().orElseThrow();
        String[] split = data.getCharBuffer().toString().split("\n");
        return Arrays.asList(split);
    }

    public static CSVParser readFileCSV(String filename, String... searchPaths) {
        return NBIO.readFileDelimCSV(filename, ',', searchPaths);
    }

    public static CSVParser readFileDelimCSV(String filename,char delim, String... searchPaths) {
        Reader reader = NBIO.readReader(filename, searchPaths);
        CSVFormat format = CSVFormat.newFormat(delim).withFirstRecordAsHeader();
        try {
            CSVParser parser = new CSVParser(reader, format);
            return parser;
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }


    private static InputStream readInputStream(String filename, String... searchPaths) {
        return NBIO.all().prefix(searchPaths).name(filename).one().getInputStream();
    }

    private static Reader readReader(String filename, String... searchPaths) {
        return NBIO.all().prefix(searchPaths).name(filename).one().getReader();
    }

    public static CharBuffer readCharBuffer(String fileName, String... searchPaths) {
        return NBIO.all().prefix(searchPaths).name(fileName).one().getCharBuffer();
    }

    public static Path getFirstLocalPath(String... potentials) {
        Optional> first = NBIO.local().name(potentials).first();
        return first.orElseThrow().asPath();
    }

    public static Optional findFirstLocalPath(String... potentials) {
        Optional> first = NBIO.local().name(potentials).first();
        Optional path = first.map(Content::asPath);
        return path;
    }

    public static InputStream readInputStream(String fromPath, String yaml, String[] searchPaths) {
        return null;
    }


    @Override
    public NBPathsAPI.GetPrefix localContent() {
        this.resolver = URIResolvers.inFS().inCP();
        return this;
    }

    @Override
    public NBPathsAPI.GetPrefix remoteContent() {
        this.resolver = URIResolvers.inURLs();
        return this;
    }

    @Override
    public NBPathsAPI.GetPrefix internalContent() {
        this.resolver = URIResolvers.inClasspath();
        return this;
    }

    @Override
    public NBPathsAPI.GetPrefix fileContent() {
        this.resolver = URIResolvers.inFS();
        return this;
    }

    @Override
    public NBPathsAPI.GetPrefix allContent() {
        this.resolver = URIResolvers.inFS().inCP().inURLs();
        return this;
    }

    @Override
    public NBPathsAPI.GetPrefix prefix(String... searchPaths) {
        ArrayList addingPaths = new ArrayList<>(this.prefixes);
        addingPaths.addAll(Arrays.asList(searchPaths));
        return new NBIO(resolver, addingPaths, names, extensions);
    }

    @Override
    public NBPathsAPI.GetExtension name(String... searchNames) {
        ArrayList addingNames = new ArrayList<>(this.names);
        addingNames.addAll(Arrays.asList(searchNames));
        return new NBIO(resolver, prefixes, addingNames, extensions);
    }

    @Override
    public NBPathsAPI.DoSearch extension(String... extensions) {
        ArrayList addingExtensions = new ArrayList<>(this.extensions);
        for (String addingExtension : extensions) {
            addingExtensions.add(dotExtension(addingExtension));
        }
        return new NBIO(resolver, prefixes, names, addingExtensions);
    }

    /**
     * Search for named resources everywhere: URLs, filesystem, classpath
     *
     * @return a builder
     */
    public static NBPathsAPI.GetPrefix all() {
        return new NBIO().allContent();
    }

    /**
     * Search for named resources in the classpath
     *
     * @return a builder
     */
    public static NBPathsAPI.GetPrefix classpath() {
        return new NBIO().internalContent();
    }

    /**
     * Search for named resources on the filesystem
     *
     * @return a builder
     */
    public static NBPathsAPI.GetPrefix fs() {
        return new NBIO().fileContent();
    }

    /**
     * Search for named resources locally: filesystem, classpath
     *
     * @return a builder
     */
    public static NBPathsAPI.GetPrefix local() {
        return new NBIO().localContent();
    }

    /**
     * Search for named resources only in URLs
     *
     * @return a builder
     */
    public static NBPathsAPI.GetPrefix remote() {
        return new NBIO().remoteContent();
    }


    @Override
    public Optional> first() {

        List> list = list();
        if (list.size() > 0) {
            return Optional.of(list.get(0));
        } else {
            return Optional.empty();
        }

    }

    public Optional> maybeOne() {
        List> list = list();

        if (list.size() > 1) {
            throw new BasicError("Found more than one source for " + this.toString() + ", but expected to find one at" +
                " most.");
        }
        throw new RuntimeException("Invalid code, go fix it, this should never happen.");
    }

    @Override
    public Content one() {


        List> list = list();
        if (list.size() == 0) {
            throw new BasicError("Unable to find even a single source for '" + this.toString() + "'");
        }

        if (list.size() > 1) {
            String found = list.stream().map(c -> c.getURI().toString()).collect(Collectors.joining(","));
            throw new BasicError(("Found too many sources for '" + this.toString() + "', ambiguous name. Pick from " + found));
        }
        return list.get(0);

    }

    @Override
    public List>> resolveEach() {
        List>> resolved = new ArrayList<>();
        for (String name : names) {
            LinkedHashSet slotSearchPaths = expandSearches(prefixes, List.of(name), extensions, false);
            Content content = null;
            for (String slotSearchPath : slotSearchPaths) {
                List> contents = resolver.resolve(slotSearchPath);
                resolved.add(contents);
            }
        }
        return resolved;
    }


    // for testing
    public LinkedHashSet expandSearches() {
        return expandSearches(prefixes, names, extensions, false);
    }


    // for testing
    public LinkedHashSet expandSearches(List thePrefixes, List names,
                                                List suffixes, boolean eachPrefix) {

        List prefixesToSearch = new ArrayList<>(thePrefixes);
        List namesToSearch = new ArrayList<>(names);
        List suffixesToSearch = new ArrayList<>(suffixes);

        if (prefixesToSearch.size() == 0) {
            prefixesToSearch.add("");
        }
        if (namesToSearch.size() == 0) {
            namesToSearch.add(".*");
        }
        if (suffixesToSearch.size() == 0) {
            suffixesToSearch.add("");
        }

        LinkedHashSet searches = new LinkedHashSet<>();

        for (String name : namesToSearch) {
            for (String suffix : suffixesToSearch) {
                String search = name;
                search = (search.endsWith(suffix) ? search : search + suffix);

                if (eachPrefix) {
                    for (String prefix : prefixesToSearch) {
                        String withPrefix = (prefix.isEmpty() ? prefix :
                            prefix + FileSystems.getDefault().getSeparator())
                            + search;
                        searches.add(withPrefix);
                    }
                } else {
                    searches.add(search);
                }
            }
        }

        return searches;
    }

//    // for testing
//    public LinkedHashSet expandSearches(String name) {
//
//        LinkedHashSet searchSet = new LinkedHashSet<>();
//
//        List searchPathsToTry = new ArrayList<>();
//        searchPathsToTry.add("");
//        searchPathsToTry.addAll(prefixes);
//
//        List extensionsToTry = new ArrayList<>();
////        extensionsToTry.add("");
//        extensionsToTry.addAll(extensions);
//
//        for (String searchPath : searchPathsToTry) {
//            for (String extension : extensionsToTry) {
//                if (!name.endsWith(extension)) {
//                    name = name + extension;
//                }
//                searchSet.add(Path.of(searchPath, name).toString());
//            }
//        }
//        return searchSet;
//    }


    @Override
    public List> list() {
        LinkedHashSet searches = expandSearches();

        LinkedHashSet> foundFiles = new LinkedHashSet<>();

        // wrap in local search iterator
        for (String search : searches) {
            List> founds = resolver.resolve(search);
            foundFiles.addAll(founds);
        }

        for (String searchPath : prefixes) {
            List founds = resolver.resolveDirectory(searchPath);
            NBIOWalker.CollectVisitor capture = new NBIOWalker.CollectVisitor(true,false);
            for (Path path : founds) {
                for (String searchPattern : searches) {
                    NBIOWalker.RegexFilter filter = new NBIOWalker.RegexFilter(searchPattern,true);
//                    RegexPathFilter filter = new RegexPathFilter(searchPattern, true);
                    NBIOWalker.walkFullPath(path, capture, filter);
                }
            }
            capture.get().stream().map(PathContent::new).forEach(foundFiles::add);
        }

        return new ArrayList<>(foundFiles);
    }

    private static String tailmatch(String name) {
        if (!name.startsWith("^") && !name.startsWith(".")) {
            name = ".*" + name;
        }
        return name;
    }

    private static String dotExtension(String extension) {
        return extension.startsWith(".") ? extension : "." + extension;
    }

//    private LinkedHashSet expandSearchPatterns(String name) {
//        LinkedHashSet expanded = new LinkedHashSet<>();
//
//        if (extensions.size()==0) {
//            expanded.add(Pattern.compile(tailmatch(name)));
//        }
//
//        for (String extension : extensions) {
//            extension = dotExtension(extension);
//            String withExtension = name.endsWith(extension) ? name : name + Pattern.quote(extension);
//            withExtension=tailmatch(withExtension);
//            Pattern pattern = Pattern.compile(withExtension);
//            expanded.add(pattern);
//        }
//        return expanded;
//    }


    @Override
    public String toString() {
        return "NBIO{" +
            "resolver=" + resolver +
            ", prefixes=" + prefixes +
            ", names=" + names +
            ", extensions=" + extensions +
            '}';
    }
}