org.dizitart.no2.fulltext.languages.Bulgarian Maven / Gradle / Ivy
/*
*
* Copyright 2017-2018 Nitrite author or authors.
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*
*/
package org.dizitart.no2.fulltext.languages;
import org.dizitart.no2.fulltext.Language;
import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;
/**
* Bulgarian stop words
*
* @since 2.1.0
* @author Anindya Chatterjee
*/
public class Bulgarian implements Language {
@Override
public Set stopWords() {
return new HashSet<>(Arrays.asList(
"ð°",
"ð°ð²ñ‚ðµð½ñ‚ð¸ñ‡ðµð½",
"ð°ð·",
"ð°ðºð¾",
"ð°ð»ð°",
"ð±ðµ",
"ð±ðµð·",
"ð±ðµñˆðµ",
"ð±ð¸",
"ð±ð¸ð²ñˆ",
"ð±ð¸ð²ñˆð°",
"ð±ð¸ð²ñˆð¾",
"ð±ð¸ð»",
"ð±ð¸ð»ð°",
"ð±ð¸ð»ð¸",
"ð±ð¸ð»ð¾",
"ð±ð»ð°ð³ð¾ð´ð°ñ€ñ",
"ð±ð»ð¸ð·ð¾",
"ð±ññ…ð°",
"ð±ñšð´ð°ñ‚",
"ð±ñšð´ðµ",
"ð²",
"ð²ð°ñ",
"ð²ð°ñˆ",
"ð²ð°ñˆð°",
"ð²ðµñ‡ðµ",
"ð²ðµñ€ð¾ññ‚ð½ð¾",
"ð²ð·ðµð¼ð°",
"ð²ð¸",
"ð²ð¸ðµ",
"ð²ð¸ð½ð°ð³ð¸",
"ð²ð½ð¸ð¼ð°ð²ð°",
"ð²ñðµ",
"ð²ñðµðºð¸",
"ð²ñð¸ñ‡ðºð¸",
"ð²ñð¸ñ‡ðºð¾",
"ð²ññðºð°",
"ð²ñšð²",
"ð²ñšð¿ñ€ðµðºð¸",
"ð²ñšñ€ñ…ñƒ",
"ð²ñ€ðµð¼ðµ",
"ð³",
"ð³ð¸",
"ð³ð»ð°ð²ðµð½",
"ð³ð»ð°ð²ð½ð°",
"ð³ð»ð°ð²ð½ð¾",
"ð³ð»ð°ñ",
"ð³ð¾",
"ð³ð¾ð´ð¸ð½ð°",
"ð³ð¾ð´ð¸ð½ð¸",
"ð³ð¾ð´ð¸ñˆðµð½",
"ð´",
"ð´ð°",
"ð´ð°ð»ð¸",
"ð´ð²ð°",
"ð´ð²ð°ð¼ð°",
"ð´ð²ð°ð¼ð°ñ‚ð°",
"ð´ð²ðµ",
"ð´ð²ðµñ‚ðµ",
"ð´ðµð½",
"ð´ð½ðµñ",
"ð´ð½ð¸",
"ð´ð¾",
"ð´ð¾ð±ñšñ€",
"ð´ð¾ð±ñ€ð°",
"ð´ð¾ð±ñ€ðµ",
"ð´ð¾ð±ñ€ð¾",
"ð´ð¾ðºð°ñ‚ð¾",
"ð´ð¾ðºð¾ð³ð°",
"ð´ð¾ñðµð³ð°",
"ð´ð¾ññ‚ð°",
"ð´ð¾ñ€ð¸",
"ð´ñ€ñƒð³",
"ð´ñ€ñƒð³ð°",
"ð´ñ€ñƒð³ð¸",
"ðµ",
"ðµð²ñ‚ð¸ð½",
"ðµð´ð²ð°",
"ðµð´ð¸ð½",
"ðµð´ð½ð°",
"ðµð´ð½ð°ðºð²ð°",
"ðµð´ð½ð°ðºð²ð¸",
"ðµð´ð½ð°ðºñšð²",
"ðµð´ð½ð¾",
"ðµðºð¸ð¿",
"ðµñ‚ð¾",
"ð¶ð¸ð²ð¾ñ‚",
"ð·ð°",
"ð·ð°ð±ð°ð²ñð¼",
"ð·ð°ð´",
"ð·ð°ðµð´ð½ð¾",
"ð·ð°ñðµð³ð°",
"ð·ð°ñð¿ð°ð»",
"ð·ð°ñ‚ð¾ð²ð°",
"ð·ð°ñ‰ð¾",
"ð·ð°ñ‰ð¾ñ‚ð¾",
"ð·ð°ñ€ð°ð´ð¸",
"ð¸",
"ð¸ð·",
"ð¸ð»ð¸",
"ð¸ð¼",
"ð¸ð¼ð°",
"ð¸ð¼ð°ñ‚",
"ð¸ñðºð°",
"ð¹",
"ðºð°ð·ð°",
"ðºð°ðº",
"ðºð°ðºð²ð°",
"ðºð°ðºð²ð¾",
"ðºð°ðºñšð²",
"ðºð°ðºñ‚ð¾",
"ðºð°ñ‚ð¾",
"ðºð¾ð³ð°",
"ðºð¾ð³ð°ñ‚ð¾",
"ðºð¾ðµñ‚ð¾",
"ðºð¾ð¸ñ‚ð¾",
"ðºð¾ð¹",
"ðºð¾ð¹ñ‚ð¾",
"ðºð¾ð»ðºð¾",
"ðºð¾ññ‚ð¾",
"ðºñšð´ðµ",
"ðºñšð´ðµñ‚ð¾",
"ðºñšð¼",
"ð»ðµñðµð½",
"ð»ðµñð½ð¾",
"ð»ð¸",
"ð»ð¾ñˆ",
"ð¼",
"ð¼ð°ð¹",
"ð¼ð°ð»ðºð¾",
"ð¼ðµ",
"ð¼ðµð¶ð´ñƒ",
"ð¼ðµðº",
"ð¼ðµð½",
"ð¼ðµñðµñ†",
"ð¼ð¸",
"ð¼ð½ð¾ð³ð¾",
"ð¼ð½ð¾ð·ð¸ð½ð°",
"ð¼ð¾ð³ð°",
"ð¼ð¾ð³ð°ñ‚",
"ð¼ð¾ð¶ðµ",
"ð¼ð¾ðºñšñ€",
"ð¼ð¾ð»ñ",
"ð¼ð¾ð¼ðµð½ñ‚ð°",
"ð¼ñƒ",
"ð½",
"ð½ð°",
"ð½ð°ð´",
"ð½ð°ð·ð°ð´",
"ð½ð°ð¹",
"ð½ð°ð¿ñ€ð°ð²ð¸",
"ð½ð°ð¿ñ€ðµð´",
"ð½ð°ð¿ñ€ð¸ð¼ðµñ€",
"ð½ð°ñ",
"ð½ðµ",
"ð½ðµð³ð¾",
"ð½ðµñ",
"ð½ðµñ‰ð¾",
"ð½ð¸",
"ð½ð¸ðµ",
"ð½ð¸ðºð¾ð¹",
"ð½ð¸ñ‚ð¾",
"ð½ð¸ñ‰ð¾",
"ð½ð¾",
"ð½ð¾ð²",
"ð½ð¾ð²ð°",
"ð½ð¾ð²ð¸",
"ð½ð¾ð²ð¸ð½ð°",
"ð½ñðºð¾ð¸",
"ð½ñðºð¾ð¹",
"ð½ñðºð¾ð»ðºð¾",
"ð½ñð¼ð°",
"ð¾ð±ð°ñ‡ðµ",
"ð¾ðºð¾ð»ð¾",
"ð¾ñð²ðµð½",
"ð¾ñð¾ð±ðµð½ð¾",
"ð¾ñ‚",
"ð¾ñ‚ð³ð¾ñ€ðµ",
"ð¾ñ‚ð½ð¾ð²ð¾",
"ð¾ñ‰ðµ",
"ð¿ð°ðº",
"ð¿ð¾",
"ð¿ð¾ð²ðµñ‡ðµ",
"ð¿ð¾ð²ðµñ‡ðµñ‚ð¾",
"ð¿ð¾ð´",
"ð¿ð¾ð½ðµ",
"ð¿ð¾ñð»ðµ",
"ð¿ð¾ñ‡ñ‚ð¸",
"ð¿ð¾ñ€ð°ð´ð¸",
"ð¿ñšðº",
"ð¿ñšñ‚ð¸",
"ð¿ñšñ€ð²ð°ñ‚ð°",
"ð¿ñšñ€ð²ð¸",
"ð¿ñšñ€ð²ð¾",
"ð¿ñ€ð°ð²ð¸",
"ð¿ñ€ðµð´",
"ð¿ñ€ðµð´ð¸",
"ð¿ñ€ðµð·",
"ð¿ñ€ð¸",
"ñ",
"ñð°",
"ñð°ð¼",
"ñð°ð¼ð¾",
"ñðµ",
"ñðµð³ð°",
"ñð¸",
"ñð¸ð½",
"ñðºð¾ñ€ð¾",
"ñð»ðµð´",
"ñð»ðµð´ð²ð°ñ‰",
"ñð¼ðµ",
"ñð¼ññ…",
"ñð¿ð¾ñ€ðµð´",
"ññšð¼",
"ññšñ",
"ññšñ‰ð¾",
"ññ‚ðµ",
"ññ€ðµð´",
"ññ€ðµñ‰ñƒ",
"ñ",
"ñðº",
"ñžð¼ñ€ñƒðº",
"ñƒ",
"ñƒñ‚ñ€ðµ",
"ñ‚",
"ñ‚.ð½.",
"ñ‚ð°ð·ð¸",
"ñ‚ð°ðºð°",
"ñ‚ð°ðºð¸ð²ð°",
"ñ‚ð°ðºñšð²",
"ñ‚ð°ð¼",
"ñ‚ð²ð¾ð¹",
"ñ‚ðµ",
"ñ‚ðµð·ð¸",
"ñ‚ð¸",
"ñ‚ð¾",
"ñ‚ð¾ð²ð°",
"ñ‚ð¾ð³ð°ð²ð°",
"ñ‚ð¾ð·ð¸",
"ñ‚ð¾ð¹",
"ñ‚ð¾ð»ðºð¾ð²ð°",
"ñ‚ð¾ñ‡ð½ð¾",
"ñ‚ñ",
"ñ‚ññ…",
"ñ‚ñšð¹",
"ñ‚ñƒðº",
"ñ‚ñ€ð¸",
"ñ‚ñ€ñð±ð²ð°",
"ñ‡",
"ñ‡ð°ñð°",
"ñ‡ðµ",
"ñ‡ðµññ‚ð¾",
"ñ‡ñ€ðµð·",
"ñ…ð°ñ€ðµñð²ð°",
"ñ…ð¸ð»ñð´ð¸",
"ñ‰ðµ",
"ñ‰ð¾ð¼",
"ñ€ð°ð²ðµð½",
"ñ€ð°ð²ð½ð°",
"а",
"автентичен",
"аз",
"ако",
"ала",
"бе",
"без",
"беше",
"би",
"бивш",
"бивша",
"бившо",
"бил",
"била",
"били",
"било",
"благодаря",
"близо",
"бъдат",
"бъде",
"бяха",
"в",
"вас",
"ваш",
"ваша",
"вероятно",
"вече",
"взема",
"ви",
"вие",
"винаги",
"внимава",
"време",
"все",
"всеки",
"всички",
"всичко",
"всяка",
"във",
"въпреки",
"върху",
"г",
"ги",
"главен",
"главна",
"главно",
"глас",
"го",
"година",
"години",
"годишен",
"д",
"да",
"дали",
"два",
"двама",
"двамата",
"две",
"двете",
"ден",
"днес",
"дни",
"до",
"добра",
"добре",
"добро",
"добър",
"докато",
"докога",
"дори",
"досега",
"доста",
"друг",
"друга",
"други",
"е",
"евтин",
"едва",
"един",
"една",
"еднаква",
"еднакви",
"еднакъв",
"едно",
"екип",
"ето",
"живот",
"за",
"забавям",
"зад",
"заедно",
"заради",
"засега",
"заспал",
"затова",
"защо",
"защото",
"и",
"из",
"или",
"им",
"има",
"имат",
"иска",
"й",
"каза",
"как",
"каква",
"какво",
"както",
"какъв",
"като",
"кога",
"когато",
"което",
"които",
"кой",
"който",
"колко",
"която",
"къде",
"където",
"към",
"лесен",
"лесно",
"ли",
"лош",
"м",
"май",
"малко",
"ме",
"между",
"мек",
"мен",
"месец",
"ми",
"много",
"мнозина",
"мога",
"могат",
"може",
"мокър",
"моля",
"момента",
"му",
"н",
"на",
"над",
"назад",
"най",
"направи",
"напред",
"например",
"нас",
"не",
"него",
"нещо",
"нея",
"ни",
"ние",
"никой",
"нито",
"нищо",
"но",
"нов",
"нова",
"нови",
"новина",
"някои",
"някой",
"няколко",
"няма",
"обаче",
"около",
"освен",
"особено",
"от",
"отгоре",
"отново",
"още",
"пак",
"по",
"повече",
"повечето",
"под",
"поне",
"поради",
"после",
"почти",
"прави",
"пред",
"преди",
"през",
"при",
"пък",
"първата",
"първи",
"първо",
"пъти",
"равен",
"равна",
"с",
"са",
"сам",
"само",
"се",
"сега",
"си",
"син",
"скоро",
"след",
"следващ",
"сме",
"смях",
"според",
"сред",
"срещу",
"сте",
"съм",
"със",
"също",
"т",
"т.н.",
"тази",
"така",
"такива",
"такъв",
"там",
"твой",
"те",
"тези",
"ти",
"то",
"това",
"тогава",
"този",
"той",
"толкова",
"точно",
"три",
"трябва",
"тук",
"тъй",
"тя",
"тях",
"у",
"утре",
"харесва",
"хиляди",
"ч",
"часа",
"че",
"често",
"чрез",
"ще",
"щом",
"юмрук",
"я",
"як"
));
}
}