All Downloads are FREE. Search and download functionalities are using the official Maven repository.

org.dizitart.no2.index.fulltext.languages.French Maven / Gradle / Ivy

/*
 * Copyright (c) 2017-2020. Nitrite author or authors.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package org.dizitart.no2.index.fulltext.languages;

import org.dizitart.no2.index.fulltext.Language;

import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;

/**
 * French stop words
 *
 * @author Anindya Chatterjee
 * @since 2.1.0
 */
public class French implements Language {
    @Override
    public Set stopWords() {
        return new HashSet<>(Arrays.asList(
            "a",
            "abord",
            "absolument",
            "afin",
            "ah",
            "ai",
            "aie",
            "aient",
            "aies",
            "ailleurs",
            "ainsi",
            "ait",
            "allaient",
            "allo",
            "allons",
            "allô",
            "alors",
            "anterieur",
            "anterieure",
            "anterieures",
            "apres",
            "après",
            "as",
            "assez",
            "attendu",
            "au",
            "aucun",
            "aucune",
            "aucuns",
            "aujourd",
            "aujourd'hui",
            "aupres",
            "auquel",
            "aura",
            "aurai",
            "auraient",
            "aurais",
            "aurait",
            "auras",
            "aurez",
            "auriez",
            "aurions",
            "aurons",
            "auront",
            "aussi",
            "autre",
            "autrefois",
            "autrement",
            "autres",
            "autrui",
            "aux",
            "auxquelles",
            "auxquels",
            "avaient",
            "avais",
            "avait",
            "avant",
            "avec",
            "avez",
            "aviez",
            "avions",
            "avoir",
            "avons",
            "ayant",
            "ayez",
            "ayons",
            "b",
            "bah",
            "bas",
            "basee",
            "bat",
            "beau",
            "beaucoup",
            "bien",
            "bigre",
            "bon",
            "boum",
            "bravo",
            "brrr",
            "c",
            "car",
            "ce",
            "ceci",
            "cela",
            "celle",
            "celle-ci",
            "celle-là",
            "celles",
            "celles-ci",
            "celles-là",
            "celui",
            "celui-ci",
            "celui-là",
            "celà",
            "cent",
            "cependant",
            "certain",
            "certaine",
            "certaines",
            "certains",
            "certes",
            "ces",
            "cet",
            "cette",
            "ceux",
            "ceux-ci",
            "ceux-là",
            "chacun",
            "chacune",
            "chaque",
            "cher",
            "chers",
            "chez",
            "chiche",
            "chut",
            "chère",
            "chères",
            "ci",
            "cinq",
            "cinquantaine",
            "cinquante",
            "cinquantième",
            "cinquième",
            "clac",
            "clic",
            "combien",
            "comme",
            "comment",
            "comparable",
            "comparables",
            "compris",
            "concernant",
            "contre",
            "couic",
            "crac",
            "d",
            "da",
            "dans",
            "de",
            "debout",
            "dedans",
            "dehors",
            "deja",
            "delà",
            "depuis",
            "dernier",
            "derniere",
            "derriere",
            "derrière",
            "des",
            "desormais",
            "desquelles",
            "desquels",
            "dessous",
            "dessus",
            "deux",
            "deuxième",
            "deuxièmement",
            "devant",
            "devers",
            "devra",
            "devrait",
            "different",
            "differentes",
            "differents",
            "différent",
            "différente",
            "différentes",
            "différents",
            "dire",
            "directe",
            "directement",
            "dit",
            "dite",
            "dits",
            "divers",
            "diverse",
            "diverses",
            "dix",
            "dix-huit",
            "dix-neuf",
            "dix-sept",
            "dixième",
            "doit",
            "doivent",
            "donc",
            "dont",
            "dos",
            "douze",
            "douzième",
            "dring",
            "droite",
            "du",
            "duquel",
            "durant",
            "dès",
            "début",
            "désormais",
            "e",
            "effet",
            "egale",
            "egalement",
            "egales",
            "eh",
            "elle",
            "elle-même",
            "elles",
            "elles-mêmes",
            "en",
            "encore",
            "enfin",
            "entre",
            "envers",
            "environ",
            "es",
            "essai",
            "est",
            "et",
            "etant",
            "etc",
            "etre",
            "eu",
            "eue",
            "eues",
            "euh",
            "eurent",
            "eus",
            "eusse",
            "eussent",
            "eusses",
            "eussiez",
            "eussions",
            "eut",
            "eux",
            "eux-mêmes",
            "exactement",
            "excepté",
            "extenso",
            "exterieur",
            "eûmes",
            "eût",
            "eûtes",
            "f",
            "fais",
            "faisaient",
            "faisant",
            "fait",
            "faites",
            "façon",
            "feront",
            "fi",
            "flac",
            "floc",
            "fois",
            "font",
            "force",
            "furent",
            "fus",
            "fusse",
            "fussent",
            "fusses",
            "fussiez",
            "fussions",
            "fut",
            "fûmes",
            "fût",
            "fûtes",
            "g",
            "gens",
            "h",
            "ha",
            "haut",
            "hein",
            "hem",
            "hep",
            "hi",
            "ho",
            "holà",
            "hop",
            "hormis",
            "hors",
            "hou",
            "houp",
            "hue",
            "hui",
            "huit",
            "huitième",
            "hum",
            "hurrah",
            "hé",
            "hélas",
            "i",
            "ici",
            "il",
            "ils",
            "importe",
            "j",
            "je",
            "jusqu",
            "jusque",
            "juste",
            "k",
            "l",
            "la",
            "laisser",
            "laquelle",
            "las",
            "le",
            "lequel",
            "les",
            "lesquelles",
            "lesquels",
            "leur",
            "leurs",
            "longtemps",
            "lors",
            "lorsque",
            "lui",
            "lui-meme",
            "lui-même",
            "là",
            "lès",
            "m",
            "ma",
            "maint",
            "maintenant",
            "mais",
            "malgre",
            "malgré",
            "maximale",
            "me",
            "meme",
            "memes",
            "merci",
            "mes",
            "mien",
            "mienne",
            "miennes",
            "miens",
            "mille",
            "mince",
            "mine",
            "minimale",
            "moi",
            "moi-meme",
            "moi-même",
            "moindres",
            "moins",
            "mon",
            "mot",
            "moyennant",
            "multiple",
            "multiples",
            "même",
            "mêmes",
            "n",
            "na",
            "naturel",
            "naturelle",
            "naturelles",
            "ne",
            "neanmoins",
            "necessaire",
            "necessairement",
            "neuf",
            "neuvième",
            "ni",
            "nombreuses",
            "nombreux",
            "nommés",
            "non",
            "nos",
            "notamment",
            "notre",
            "nous",
            "nous-mêmes",
            "nouveau",
            "nouveaux",
            "nul",
            "néanmoins",
            "nôtre",
            "nôtres",
            "o",
            "oh",
            "ohé",
            "ollé",
            "olé",
            "on",
            "ont",
            "onze",
            "onzième",
            "ore",
            "ou",
            "ouf",
            "ouias",
            "oust",
            "ouste",
            "outre",
            "ouvert",
            "ouverte",
            "ouverts",
            "o|",
            "où",
            "p",
            "paf",
            "pan",
            "par",
            "parce",
            "parfois",
            "parle",
            "parlent",
            "parler",
            "parmi",
            "parole",
            "parseme",
            "partant",
            "particulier",
            "particulière",
            "particulièrement",
            "pas",
            "passé",
            "pendant",
            "pense",
            "permet",
            "personne",
            "personnes",
            "peu",
            "peut",
            "peuvent",
            "peux",
            "pff",
            "pfft",
            "pfut",
            "pif",
            "pire",
            "pièce",
            "plein",
            "plouf",
            "plupart",
            "plus",
            "plusieurs",
            "plutôt",
            "possessif",
            "possessifs",
            "possible",
            "possibles",
            "pouah",
            "pour",
            "pourquoi",
            "pourrais",
            "pourrait",
            "pouvait",
            "prealable",
            "precisement",
            "premier",
            "première",
            "premièrement",
            "pres",
            "probable",
            "probante",
            "procedant",
            "proche",
            "près",
            "psitt",
            "pu",
            "puis",
            "puisque",
            "pur",
            "pure",
            "q",
            "qu",
            "quand",
            "quant",
            "quant-à-soi",
            "quanta",
            "quarante",
            "quatorze",
            "quatre",
            "quatre-vingt",
            "quatrième",
            "quatrièmement",
            "que",
            "quel",
            "quelconque",
            "quelle",
            "quelles",
            "quelqu'un",
            "quelque",
            "quelques",
            "quels",
            "qui",
            "quiconque",
            "quinze",
            "quoi",
            "quoique",
            "r",
            "rare",
            "rarement",
            "rares",
            "relative",
            "relativement",
            "remarquable",
            "rend",
            "rendre",
            "restant",
            "reste",
            "restent",
            "restrictif",
            "retour",
            "revoici",
            "revoilà",
            "rien",
            "s",
            "sa",
            "sacrebleu",
            "sait",
            "sans",
            "sapristi",
            "sauf",
            "se",
            "sein",
            "seize",
            "selon",
            "semblable",
            "semblaient",
            "semble",
            "semblent",
            "sent",
            "sept",
            "septième",
            "sera",
            "serai",
            "seraient",
            "serais",
            "serait",
            "seras",
            "serez",
            "seriez",
            "serions",
            "serons",
            "seront",
            "ses",
            "seul",
            "seule",
            "seulement",
            "si",
            "sien",
            "sienne",
            "siennes",
            "siens",
            "sinon",
            "six",
            "sixième",
            "soi",
            "soi-même",
            "soient",
            "sois",
            "soit",
            "soixante",
            "sommes",
            "son",
            "sont",
            "sous",
            "souvent",
            "soyez",
            "soyons",
            "specifique",
            "specifiques",
            "speculatif",
            "stop",
            "strictement",
            "subtiles",
            "suffisant",
            "suffisante",
            "suffit",
            "suis",
            "suit",
            "suivant",
            "suivante",
            "suivantes",
            "suivants",
            "suivre",
            "sujet",
            "superpose",
            "sur",
            "surtout",
            "t",
            "ta",
            "tac",
            "tandis",
            "tant",
            "tardive",
            "te",
            "tel",
            "telle",
            "tellement",
            "telles",
            "tels",
            "tenant",
            "tend",
            "tenir",
            "tente",
            "tes",
            "tic",
            "tien",
            "tienne",
            "tiennes",
            "tiens",
            "toc",
            "toi",
            "toi-même",
            "ton",
            "touchant",
            "toujours",
            "tous",
            "tout",
            "toute",
            "toutefois",
            "toutes",
            "treize",
            "trente",
            "tres",
            "trois",
            "troisième",
            "troisièmement",
            "trop",
            "très",
            "tsoin",
            "tsouin",
            "tu",
            "té",
            "u",
            "un",
            "une",
            "unes",
            "uniformement",
            "unique",
            "uniques",
            "uns",
            "v",
            "va",
            "vais",
            "valeur",
            "vas",
            "vers",
            "via",
            "vif",
            "vifs",
            "vingt",
            "vivat",
            "vive",
            "vives",
            "vlan",
            "voici",
            "voie",
            "voient",
            "voilà",
            "vont",
            "vos",
            "votre",
            "vous",
            "vous-mêmes",
            "vu",
            "vé",
            "vôtre",
            "vôtres",
            "w",
            "x",
            "y",
            "z",
            "zut",
            "à",
            "â",
            "ça",
            "ès",
            "étaient",
            "étais",
            "était",
            "étant",
            "état",
            "étiez",
            "étions",
            "été",
            "étée",
            "étées",
            "étés",
            "êtes",
            "être",
            "ô"
        ));
    }
}




© 2015 - 2025 Weber Informatics LLC | Privacy Policy