All Downloads are FREE. Search and download functionalities are using the official Maven repository.

org.dizitart.no2.fulltext.languages.Romanian Maven / Gradle / Ivy

There is a newer version: 4.3.0
Show newest version
/*
 *
 * Copyright 2017-2018 Nitrite author or authors.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *        http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 *
 */

package org.dizitart.no2.fulltext.languages;

import org.dizitart.no2.fulltext.Language;

import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;

/**
 * Romanian stop words
 *
 * @since 2.1.0
 * @author Anindya Chatterjee
 */
public class Romanian implements Language {
    @Override
    public Set stopWords() {
        return new HashSet<>(Arrays.asList(
                "a",
                "abia",
                "acea",
                "aceasta",
                "această",
                "aceea",
                "aceeasi",
                "acei",
                "aceia",
                "acel",
                "acela",
                "acelasi",
                "acele",
                "acelea",
                "acest",
                "acesta",
                "aceste",
                "acestea",
                "acestei",
                "acestia",
                "acestui",
                "aceşti",
                "aceştia",
                "acolo",
                "acord",
                "acum",
                "adica",
                "ai",
                "aia",
                "aibă",
                "aici",
                "aiurea",
                "al",
                "ala",
                "alaturi",
                "ale",
                "alea",
                "alt",
                "alta",
                "altceva",
                "altcineva",
                "alte",
                "altfel",
                "alti",
                "altii",
                "altul",
                "am",
                "anume",
                "apoi",
                "ar",
                "are",
                "as",
                "asa",
                "asemenea",
                "asta",
                "astazi",
                "astea",
                "astfel",
                "astăzi",
                "asupra",
                "atare",
                "atat",
                "atata",
                "atatea",
                "atatia",
                "ati",
                "atit",
                "atita",
                "atitea",
                "atitia",
                "atunci",
                "au",
                "avea",
                "avem",
                "aveţi",
                "avut",
                "azi",
                "aş",
                "aşadar",
                "aţi",
                "b",
                "ba",
                "bine",
                "bucur",
                "bună",
                "c",
                "ca",
                "cam",
                "cand",
                "capat",
                "care",
                "careia",
                "carora",
                "caruia",
                "cat",
                "catre",
                "caut",
                "ce",
                "cea",
                "ceea",
                "cei",
                "ceilalti",
                "cel",
                "cele",
                "celor",
                "ceva",
                "chiar",
                "ci",
                "cinci",
                "cind",
                "cine",
                "cineva",
                "cit",
                "cita",
                "cite",
                "citeva",
                "citi",
                "citiva",
                "conform",
                "contra",
                "cu",
                "cui",
                "cum",
                "cumva",
                "curând",
                "curînd",
                "când",
                "cât",
                "câte",
                "câtva",
                "câţi",
                "cînd",
                "cît",
                "cîte",
                "cîtva",
                "cîţi",
                "că",
                "căci",
                "cărei",
                "căror",
                "cărui",
                "către",
                "d",
                "da",
                "daca",
                "dacă",
                "dar",
                "dat",
                "datorită",
                "dată",
                "dau",
                "de",
                "deasupra",
                "deci",
                "decit",
                "degraba",
                "deja",
                "deoarece",
                "departe",
                "desi",
                "despre",
                "deşi",
                "din",
                "dinaintea",
                "dintr",
                "dintr-",
                "dintre",
                "doar",
                "doi",
                "doilea",
                "două",
                "drept",
                "dupa",
                "după",
                "dă",
                "e",
                "ea",
                "ei",
                "el",
                "ele",
                "era",
                "eram",
                "este",
                "eu",
                "exact",
                "eşti",
                "f",
                "face",
                "fara",
                "fata",
                "fel",
                "fi",
                "fie",
                "fiecare",
                "fii",
                "fim",
                "fiu",
                "fiţi",
                "foarte",
                "fost",
                "frumos",
                "fără",
                "g",
                "geaba",
                "graţie",
                "h",
                "halbă",
                "i",
                "ia",
                "iar",
                "ieri",
                "ii",
                "il",
                "imi",
                "in",
                "inainte",
                "inapoi",
                "inca",
                "incit",
                "insa",
                "intr",
                "intre",
                "isi",
                "iti",
                "j",
                "k",
                "l",
                "la",
                "le",
                "li",
                "lor",
                "lui",
                "lângă",
                "lîngă",
                "m",
                "ma",
                "mai",
                "mare",
                "mea",
                "mei",
                "mele",
                "mereu",
                "meu",
                "mi",
                "mie",
                "mine",
                "mod",
                "mult",
                "multa",
                "multe",
                "multi",
                "multă",
                "mulţi",
                "mulţumesc",
                "mâine",
                "mîine",
                "mă",
                "n",
                "ne",
                "nevoie",
                "ni",
                "nici",
                "niciodata",
                "nicăieri",
                "nimeni",
                "nimeri",
                "nimic",
                "niste",
                "nişte",
                "noastre",
                "noastră",
                "noi",
                "noroc",
                "nostri",
                "nostru",
                "nou",
                "noua",
                "nouă",
                "noştri",
                "nu",
                "numai",
                "o",
                "opt",
                "or",
                "ori",
                "oricare",
                "orice",
                "oricine",
                "oricum",
                "oricând",
                "oricât",
                "oricînd",
                "oricît",
                "oriunde",
                "p",
                "pai",
                "parca",
                "patra",
                "patru",
                "patrulea",
                "pe",
                "pentru",
                "peste",
                "pic",
                "pina",
                "plus",
                "poate",
                "pot",
                "prea",
                "prima",
                "primul",
                "prin",
                "printr-",
                "putini",
                "puţin",
                "puţina",
                "puţină",
                "până",
                "pînă",
                "r",
                "rog",
                "s",
                "sa",
                "sa-mi",
                "sa-ti",
                "sai",
                "sale",
                "sau",
                "se",
                "si",
                "sint",
                "sintem",
                "spate",
                "spre",
                "sub",
                "sunt",
                "suntem",
                "sunteţi",
                "sus",
                "sută",
                "sînt",
                "sîntem",
                "sînteţi",
                "să",
                "săi",
                "său",
                "t",
                "ta",
                "tale",
                "te",
                "ti",
                "timp",
                "tine",
                "toata",
                "toate",
                "toată",
                "tocmai",
                "tot",
                "toti",
                "totul",
                "totusi",
                "totuşi",
                "toţi",
                "trei",
                "treia",
                "treilea",
                "tu",
                "tuturor",
                "tăi",
                "tău",
                "u",
                "ul",
                "ului",
                "un",
                "una",
                "unde",
                "undeva",
                "unei",
                "uneia",
                "unele",
                "uneori",
                "unii",
                "unor",
                "unora",
                "unu",
                "unui",
                "unuia",
                "unul",
                "v",
                "va",
                "vi",
                "voastre",
                "voastră",
                "voi",
                "vom",
                "vor",
                "vostru",
                "vouă",
                "voştri",
                "vreme",
                "vreo",
                "vreun",
                "vă",
                "x",
                "z",
                "zece",
                "zero",
                "zi",
                "zice",
                "îi",
                "îl",
                "îmi",
                "împotriva",
                "în",
                "înainte",
                "înaintea",
                "încotro",
                "încât",
                "încît",
                "între",
                "întrucât",
                "întrucît",
                "îţi",
                "ăla",
                "ălea",
                "ăsta",
                "ăstea",
                "ăştia",
                "şapte",
                "şase",
                "şi",
                "ştiu",
                "ţi",
                "ţie"
        ));
    }
}




© 2015 - 2024 Weber Informatics LLC | Privacy Policy