All Downloads are FREE. Search and download functionalities are using the official Maven repository.

org.dizitart.no2.fulltext.languages.Dutch Maven / Gradle / Ivy

There is a newer version: 4.3.0
Show newest version
/*
 *
 * Copyright 2017-2018 Nitrite author or authors.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *        http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 *
 */

package org.dizitart.no2.fulltext.languages;

import org.dizitart.no2.fulltext.Language;

import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;

/**
 * Dutch stop words
 *
 * @since 2.1.0
 * @author Anindya Chatterjee
 */
public class Dutch implements Language {
    @Override
    public Set stopWords() {
        return new HashSet<>(Arrays.asList(
                "aan",
                "aangaande",
                "aangezien",
                "achte",
                "achter",
                "achterna",
                "af",
                "afgelopen",
                "al",
                "aldaar",
                "aldus",
                "alhoewel",
                "alias",
                "alle",
                "allebei",
                "alleen",
                "alles",
                "als",
                "alsnog",
                "altijd",
                "altoos",
                "ander",
                "andere",
                "anders",
                "anderszins",
                "beetje",
                "behalve",
                "behoudens",
                "beide",
                "beiden",
                "ben",
                "beneden",
                "bent",
                "bepaald",
                "betreffende",
                "bij",
                "bijna",
                "bijv",
                "binnen",
                "binnenin",
                "blijkbaar",
                "blijken",
                "boven",
                "bovenal",
                "bovendien",
                "bovengenoemd",
                "bovenstaand",
                "bovenvermeld",
                "buiten",
                "bv",
                "daar",
                "daardoor",
                "daarheen",
                "daarin",
                "daarna",
                "daarnet",
                "daarom",
                "daarop",
                "daaruit",
                "daarvanlangs",
                "dan",
                "dat",
                "de",
                "deden",
                "deed",
                "der",
                "derde",
                "derhalve",
                "dertig",
                "deze",
                "dhr",
                "die",
                "dikwijls",
                "dit",
                "doch",
                "doe",
                "doen",
                "doet",
                "door",
                "doorgaand",
                "drie",
                "duizend",
                "dus",
                "echter",
                "een",
                "eens",
                "eer",
                "eerdat",
                "eerder",
                "eerlang",
                "eerst",
                "eerste",
                "eigen",
                "eigenlijk",
                "elk",
                "elke",
                "en",
                "enig",
                "enige",
                "enigszins",
                "enkel",
                "er",
                "erdoor",
                "erg",
                "ergens",
                "etc",
                "etcetera",
                "even",
                "eveneens",
                "evenwel",
                "gauw",
                "ge",
                "gedurende",
                "geen",
                "gehad",
                "gekund",
                "geleden",
                "gelijk",
                "gemoeten",
                "gemogen",
                "genoeg",
                "geweest",
                "gewoon",
                "gewoonweg",
                "haar",
                "haarzelf",
                "had",
                "hadden",
                "hare",
                "heb",
                "hebben",
                "hebt",
                "hedden",
                "heeft",
                "heel",
                "hem",
                "hemzelf",
                "hen",
                "het",
                "hetzelfde",
                "hier",
                "hierbeneden",
                "hierboven",
                "hierin",
                "hierna",
                "hierom",
                "hij",
                "hijzelf",
                "hoe",
                "hoewel",
                "honderd",
                "hun",
                "hunne",
                "ieder",
                "iedere",
                "iedereen",
                "iemand",
                "iets",
                "ik",
                "ikzelf",
                "in",
                "inderdaad",
                "inmiddels",
                "intussen",
                "inzake",
                "is",
                "ja",
                "je",
                "jezelf",
                "jij",
                "jijzelf",
                "jou",
                "jouw",
                "jouwe",
                "juist",
                "jullie",
                "kan",
                "klaar",
                "kon",
                "konden",
                "krachtens",
                "kun",
                "kunnen",
                "kunt",
                "laatst",
                "later",
                "liever",
                "lijken",
                "lijkt",
                "maak",
                "maakt",
                "maakte",
                "maakten",
                "maar",
                "mag",
                "maken",
                "me",
                "meer",
                "meest",
                "meestal",
                "men",
                "met",
                "mevr",
                "mezelf",
                "mij",
                "mijn",
                "mijnent",
                "mijner",
                "mijzelf",
                "minder",
                "miss",
                "misschien",
                "missen",
                "mits",
                "mocht",
                "mochten",
                "moest",
                "moesten",
                "moet",
                "moeten",
                "mogen",
                "mr",
                "mrs",
                "mw",
                "na",
                "naar",
                "nadat",
                "nam",
                "namelijk",
                "nee",
                "neem",
                "negen",
                "nemen",
                "nergens",
                "net",
                "niemand",
                "niet",
                "niets",
                "niks",
                "noch",
                "nochtans",
                "nog",
                "nogal",
                "nooit",
                "nu",
                "nv",
                "of",
                "ofschoon",
                "om",
                "omdat",
                "omhoog",
                "omlaag",
                "omstreeks",
                "omtrent",
                "omver",
                "ondanks",
                "onder",
                "ondertussen",
                "ongeveer",
                "ons",
                "onszelf",
                "onze",
                "onzeker",
                "ooit",
                "ook",
                "op",
                "opnieuw",
                "opzij",
                "over",
                "overal",
                "overeind",
                "overige",
                "overigens",
                "paar",
                "pas",
                "per",
                "precies",
                "recent",
                "redelijk",
                "reeds",
                "rond",
                "rondom",
                "samen",
                "sedert",
                "sinds",
                "sindsdien",
                "slechts",
                "sommige",
                "spoedig",
                "steeds",
                "tamelijk",
                "te",
                "tegen",
                "tegenover",
                "tenzij",
                "terwijl",
                "thans",
                "tien",
                "tiende",
                "tijdens",
                "tja",
                "toch",
                "toe",
                "toen",
                "toenmaals",
                "toenmalig",
                "tot",
                "totdat",
                "tussen",
                "twee",
                "tweede",
                "u",
                "uit",
                "uitgezonderd",
                "uw",
                "vaak",
                "vaakwat",
                "van",
                "vanaf",
                "vandaan",
                "vanuit",
                "vanwege",
                "veel",
                "veeleer",
                "veertig",
                "verder",
                "verscheidene",
                "verschillende",
                "vervolgens",
                "via",
                "vier",
                "vierde",
                "vijf",
                "vijfde",
                "vijftig",
                "vol",
                "volgend",
                "volgens",
                "voor",
                "vooraf",
                "vooral",
                "vooralsnog",
                "voorbij",
                "voordat",
                "voordezen",
                "voordien",
                "voorheen",
                "voorop",
                "voorts",
                "vooruit",
                "vrij",
                "vroeg",
                "waar",
                "waarom",
                "waarschijnlijk",
                "wanneer",
                "want",
                "waren",
                "was",
                "wat",
                "we",
                "wederom",
                "weer",
                "weg",
                "wegens",
                "weinig",
                "wel",
                "weldra",
                "welk",
                "welke",
                "werd",
                "werden",
                "werder",
                "wezen",
                "whatever",
                "wie",
                "wiens",
                "wier",
                "wij",
                "wijzelf",
                "wil",
                "wilden",
                "willen",
                "word",
                "worden",
                "wordt",
                "zal",
                "ze",
                "zei",
                "zeker",
                "zelf",
                "zelfde",
                "zelfs",
                "zes",
                "zeven",
                "zich",
                "zichzelf",
                "zij",
                "zijn",
                "zijne",
                "zijzelf",
                "zo",
                "zoals",
                "zodat",
                "zodra",
                "zonder",
                "zou",
                "zouden",
                "zowat",
                "zulk",
                "zulke",
                "zullen",
                "zult"
        ));
    }
}




© 2015 - 2024 Weber Informatics LLC | Privacy Policy