org.dizitart.no2.fulltext.languages.Malay Maven / Gradle / Ivy
/*
*
* Copyright 2017-2018 Nitrite author or authors.
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*
*/
package org.dizitart.no2.fulltext.languages;
import org.dizitart.no2.fulltext.Language;
import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;
/**
* Malay stop words
*
* @since 2.1.0
* @author Anindya Chatterjee
*/
public class Malay implements Language {
@Override
public Set stopWords() {
return new HashSet<>(Arrays.asList(
"abdul",
"abdullah",
"acara",
"ada",
"adalah",
"ahmad",
"air",
"akan",
"akhbar",
"akhir",
"aktiviti",
"alam",
"amat",
"amerika",
"anak",
"anggota",
"antara",
"antarabangsa",
"apa",
"apabila",
"april",
"as",
"asas",
"asean",
"asia",
"asing",
"atas",
"atau",
"australia",
"awal",
"awam",
"bagaimanapun",
"bagi",
"bahagian",
"bahan",
"baharu",
"bahawa",
"baik",
"bandar",
"bank",
"banyak",
"barangan",
"baru",
"baru-baru",
"bawah",
"beberapa",
"bekas",
"beliau",
"belum",
"berada",
"berakhir",
"berbanding",
"berdasarkan",
"berharap",
"berikutan",
"berjaya",
"berjumlah",
"berkaitan",
"berkata",
"berkenaan",
"berlaku",
"bermula",
"bernama",
"bernilai",
"bersama",
"berubah",
"besar",
"bhd",
"bidang",
"bilion",
"bn",
"boleh",
"bukan",
"bulan",
"bursa",
"cadangan",
"china",
"dagangan",
"dalam",
"dan",
"dana",
"dapat",
"dari",
"daripada",
"dasar",
"datang",
"datuk",
"demikian",
"dengan",
"depan",
"derivatives",
"dewan",
"di",
"diadakan",
"dibuka",
"dicatatkan",
"dijangka",
"diniagakan",
"dis",
"disember",
"ditutup",
"dolar",
"dr",
"dua",
"dunia",
"ekonomi",
"eksekutif",
"eksport",
"empat",
"enam",
"faedah",
"feb",
"global",
"hadapan",
"hanya",
"harga",
"hari",
"hasil",
"hingga",
"hubungan",
"ia",
"iaitu",
"ialah",
"indeks",
"india",
"indonesia",
"industri",
"ini",
"islam",
"isnin",
"isu",
"itu",
"jabatan",
"jalan",
"jan",
"jawatan",
"jawatankuasa",
"jepun",
"jika",
"jualan",
"juga",
"julai",
"jumaat",
"jumlah",
"jun",
"juta",
"kadar",
"kalangan",
"kali",
"kami",
"kata",
"katanya",
"kaunter",
"kawasan",
"ke",
"keadaan",
"kecil",
"kedua",
"kedua-dua",
"kedudukan",
"kekal",
"kementerian",
"kemudahan",
"kenaikan",
"kenyataan",
"kepada",
"kepentingan",
"keputusan",
"kerajaan",
"kerana",
"kereta",
"kerja",
"kerjasama",
"kes",
"keselamatan",
"keseluruhan",
"kesihatan",
"ketika",
"ketua",
"keuntungan",
"kewangan",
"khamis",
"kini",
"kira-kira",
"kita",
"klci",
"klibor",
"komposit",
"kontrak",
"kos",
"kuala",
"kuasa",
"kukuh",
"kumpulan",
"lagi",
"lain",
"langkah",
"laporan",
"lebih",
"lepas",
"lima",
"lot",
"luar",
"lumpur",
"mac",
"mahkamah",
"mahu",
"majlis",
"makanan",
"maklumat",
"malam",
"malaysia",
"mana",
"manakala",
"masa",
"masalah",
"masih",
"masing-masing",
"masyarakat",
"mata",
"media",
"mei",
"melalui",
"melihat",
"memandangkan",
"memastikan",
"membantu",
"membawa",
"memberi",
"memberikan",
"membolehkan",
"membuat",
"mempunyai",
"menambah",
"menarik",
"menawarkan",
"mencapai",
"mencatatkan",
"mendapat",
"mendapatkan",
"menerima",
"menerusi",
"mengadakan",
"mengambil",
"mengenai",
"menggalakkan",
"menggunakan",
"mengikut",
"mengumumkan",
"mengurangkan",
"meningkat",
"meningkatkan",
"menjadi",
"menjelang",
"menokok",
"menteri",
"menunjukkan",
"menurut",
"menyaksikan",
"menyediakan",
"mereka",
"merosot",
"merupakan",
"mesyuarat",
"minat",
"minggu",
"minyak",
"modal",
"mohd",
"mudah",
"mungkin",
"naik",
"najib",
"nasional",
"negara",
"negara-negara",
"negeri",
"niaga",
"nilai",
"nov",
"ogos",
"okt",
"oleh",
"operasi",
"orang",
"pada",
"pagi",
"paling",
"pameran",
"papan",
"para",
"paras",
"parlimen",
"parti",
"pasaran",
"pasukan",
"pegawai",
"pejabat",
"pekerja",
"pelabur",
"pelaburan",
"pelancongan",
"pelanggan",
"pelbagai",
"peluang",
"pembangunan",
"pemberita",
"pembinaan",
"pemimpin",
"pendapatan",
"pendidikan",
"penduduk",
"penerbangan",
"pengarah",
"pengeluaran",
"pengerusi",
"pengguna",
"pengurusan",
"peniaga",
"peningkatan",
"penting",
"peratus",
"perdagangan",
"perdana",
"peringkat",
"perjanjian",
"perkara",
"perkhidmatan",
"perladangan",
"perlu",
"permintaan",
"perniagaan",
"persekutuan",
"persidangan",
"pertama",
"pertubuhan",
"pertumbuhan",
"perusahaan",
"peserta",
"petang",
"pihak",
"pilihan",
"pinjaman",
"polis",
"politik",
"presiden",
"prestasi",
"produk",
"program",
"projek",
"proses",
"proton",
"pukul",
"pula",
"pusat",
"rabu",
"rakan",
"rakyat",
"ramai",
"rantau",
"raya",
"rendah",
"ringgit",
"rumah",
"sabah",
"sahaja",
"saham",
"sama",
"sarawak",
"satu",
"sawit",
"saya",
"sdn",
"sebagai",
"sebahagian",
"sebanyak",
"sebarang",
"sebelum",
"sebelumnya",
"sebuah",
"secara",
"sedang",
"segi",
"sehingga",
"sejak",
"sekarang",
"sektor",
"sekuriti",
"selain",
"selama",
"selasa",
"selatan",
"selepas",
"seluruh",
"semakin",
"semalam",
"semasa",
"sementara",
"semua",
"semula",
"sen",
"sendiri",
"seorang",
"sepanjang",
"seperti",
"sept",
"september",
"serantau",
"seri",
"serta",
"sesi",
"setiap",
"setiausaha",
"sidang",
"singapura",
"sini",
"sistem",
"sokongan",
"sri",
"sudah",
"sukan",
"suku",
"sumber",
"supaya",
"susut",
"syarikat",
"syed",
"tahap",
"tahun",
"tan",
"tanah",
"tanpa",
"tawaran",
"teknologi",
"telah",
"tempat",
"tempatan",
"tempoh",
"tenaga",
"tengah",
"tentang",
"terbaik",
"terbang",
"terbesar",
"terbuka",
"terdapat",
"terhadap",
"termasuk",
"tersebut",
"terus",
"tetapi",
"thailand",
"tiada",
"tidak",
"tiga",
"timbalan",
"timur",
"tindakan",
"tinggi",
"tun",
"tunai",
"turun",
"turut",
"umno",
"unit",
"untuk",
"untung",
"urus",
"usaha",
"utama",
"walaupun",
"wang",
"wanita",
"wilayah",
"yang"
));
}
}