org.dizitart.no2.fulltext.languages.Slovenian Maven / Gradle / Ivy
/*
*
* Copyright 2017-2018 Nitrite author or authors.
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*
*/
package org.dizitart.no2.fulltext.languages;
import org.dizitart.no2.fulltext.Language;
import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;
/**
* Slovenian stop words
*
* @since 2.1.0
* @author Anindya Chatterjee
*/
public class Slovenian implements Language {
@Override
public Set stopWords() {
return new HashSet<>(Arrays.asList(
"a",
"ali",
"april",
"avgust",
"b",
"bi",
"bil",
"bila",
"bile",
"bili",
"bilo",
"biti",
"blizu",
"bo",
"bodo",
"bojo",
"bolj",
"bom",
"bomo",
"boste",
"bova",
"boš",
"brez",
"c",
"cel",
"cela",
"celi",
"celo",
"d",
"da",
"daleč",
"dan",
"danes",
"datum",
"december",
"deset",
"deseta",
"deseti",
"deseto",
"devet",
"deveta",
"deveti",
"deveto",
"do",
"dober",
"dobra",
"dobri",
"dobro",
"dokler",
"dol",
"dolg",
"dolga",
"dolgi",
"dovolj",
"drug",
"druga",
"drugi",
"drugo",
"dva",
"dve",
"e",
"eden",
"en",
"ena",
"ene",
"eni",
"enkrat",
"eno",
"etc.",
"f",
"februar",
"g",
"g.",
"ga",
"ga.",
"gor",
"gospa",
"gospod",
"h",
"halo",
"i",
"idr.",
"ii",
"iii",
"in",
"iv",
"ix",
"iz",
"j",
"januar",
"jaz",
"je",
"ji",
"jih",
"jim",
"jo",
"julij",
"junij",
"jutri",
"k",
"kadarkoli",
"kaj",
"kajti",
"kako",
"kakor",
"kamor",
"kamorkoli",
"kar",
"karkoli",
"katerikoli",
"kdaj",
"kdo",
"kdorkoli",
"ker",
"ki",
"kje",
"kjer",
"kjerkoli",
"ko",
"koder",
"koderkoli",
"koga",
"komu",
"kot",
"kratek",
"kratka",
"kratke",
"kratki",
"l",
"lahka",
"lahke",
"lahki",
"lahko",
"le",
"lep",
"lepa",
"lepe",
"lepi",
"lepo",
"leto",
"m",
"maj",
"majhen",
"majhna",
"majhni",
"malce",
"malo",
"manj",
"marec",
"me",
"med",
"medtem",
"mene",
"mesec",
"mi",
"midva",
"midve",
"mnogo",
"moj",
"moja",
"moje",
"mora",
"morajo",
"moram",
"moramo",
"morate",
"moraš",
"morem",
"mu",
"n",
"na",
"nad",
"naj",
"najina",
"najino",
"najmanj",
"naju",
"največ",
"nam",
"narobe",
"nas",
"nato",
"nazaj",
"naš",
"naša",
"naše",
"ne",
"nedavno",
"nedelja",
"nek",
"neka",
"nekaj",
"nekatere",
"nekateri",
"nekatero",
"nekdo",
"neke",
"nekega",
"neki",
"nekje",
"neko",
"nekoga",
"nekoč",
"ni",
"nikamor",
"nikdar",
"nikjer",
"nikoli",
"nič",
"nje",
"njega",
"njegov",
"njegova",
"njegovo",
"njej",
"njemu",
"njen",
"njena",
"njeno",
"nji",
"njih",
"njihov",
"njihova",
"njihovo",
"njiju",
"njim",
"njo",
"njun",
"njuna",
"njuno",
"no",
"nocoj",
"november",
"npr.",
"o",
"ob",
"oba",
"obe",
"oboje",
"od",
"odprt",
"odprta",
"odprti",
"okoli",
"oktober",
"on",
"onadva",
"one",
"oni",
"onidve",
"osem",
"osma",
"osmi",
"osmo",
"oz.",
"p",
"pa",
"pet",
"peta",
"petek",
"peti",
"peto",
"po",
"pod",
"pogosto",
"poleg",
"poln",
"polna",
"polni",
"polno",
"ponavadi",
"ponedeljek",
"ponovno",
"potem",
"povsod",
"pozdravljen",
"pozdravljeni",
"prav",
"prava",
"prave",
"pravi",
"pravo",
"prazen",
"prazna",
"prazno",
"prbl.",
"precej",
"pred",
"prej",
"preko",
"pri",
"pribl.",
"približno",
"primer",
"pripravljen",
"pripravljena",
"pripravljeni",
"proti",
"prva",
"prvi",
"prvo",
"r",
"ravno",
"redko",
"res",
"reč",
"s",
"saj",
"sam",
"sama",
"same",
"sami",
"samo",
"se",
"sebe",
"sebi",
"sedaj",
"sedem",
"sedma",
"sedmi",
"sedmo",
"sem",
"september",
"seveda",
"si",
"sicer",
"skoraj",
"skozi",
"slab",
"smo",
"so",
"sobota",
"spet",
"sreda",
"srednja",
"srednji",
"sta",
"ste",
"stran",
"stvar",
"sva",
"t",
"ta",
"tak",
"taka",
"take",
"taki",
"tako",
"takoj",
"tam",
"te",
"tebe",
"tebi",
"tega",
"težak",
"težka",
"težki",
"težko",
"ti",
"tista",
"tiste",
"tisti",
"tisto",
"tj.",
"tja",
"to",
"toda",
"torek",
"tretja",
"tretje",
"tretji",
"tri",
"tu",
"tudi",
"tukaj",
"tvoj",
"tvoja",
"tvoje",
"u",
"v",
"vaju",
"vam",
"vas",
"vaš",
"vaša",
"vaše",
"ve",
"vedno",
"velik",
"velika",
"veliki",
"veliko",
"vendar",
"ves",
"več",
"vi",
"vidva",
"vii",
"viii",
"visok",
"visoka",
"visoke",
"visoki",
"vsa",
"vsaj",
"vsak",
"vsaka",
"vsakdo",
"vsake",
"vsaki",
"vsakomur",
"vse",
"vsega",
"vsi",
"vso",
"včasih",
"včeraj",
"x",
"z",
"za",
"zadaj",
"zadnji",
"zakaj",
"zaprta",
"zaprti",
"zaprto",
"zdaj",
"zelo",
"zunaj",
"č",
"če",
"često",
"četrta",
"četrtek",
"četrti",
"četrto",
"čez",
"čigav",
"š",
"šest",
"šesta",
"šesti",
"šesto",
"štiri",
"ž",
"že"
));
}
}