This commit is contained in:
801
crates/kreuzberg/stopwords/fa_stopwords.json
Normal file
801
crates/kreuzberg/stopwords/fa_stopwords.json
Normal file
@@ -0,0 +1,801 @@
|
||||
[
|
||||
"!",
|
||||
",",
|
||||
".",
|
||||
":",
|
||||
";",
|
||||
"،",
|
||||
"؛",
|
||||
"؟",
|
||||
"آباد",
|
||||
"آره",
|
||||
"آری",
|
||||
"آمد",
|
||||
"آمده",
|
||||
"آن",
|
||||
"آنان",
|
||||
"آنجا",
|
||||
"آنطور",
|
||||
"آنقدر",
|
||||
"آنكه",
|
||||
"آنها",
|
||||
"آنچه",
|
||||
"آنکه",
|
||||
"آورد",
|
||||
"آورده",
|
||||
"آيد",
|
||||
"آی",
|
||||
"آیا",
|
||||
"آیند",
|
||||
"اتفاقا",
|
||||
"اثرِ",
|
||||
"احتراما",
|
||||
"احتمالا",
|
||||
"اخیر",
|
||||
"اری",
|
||||
"از",
|
||||
"ازجمله",
|
||||
"اساسا",
|
||||
"است",
|
||||
"استفاد",
|
||||
"استفاده",
|
||||
"اش",
|
||||
"اشکارا",
|
||||
"اصلا",
|
||||
"اصولا",
|
||||
"اعلام",
|
||||
"اغلب",
|
||||
"اكنون",
|
||||
"الان",
|
||||
"البته",
|
||||
"البتّه",
|
||||
"ام",
|
||||
"اما",
|
||||
"امروز",
|
||||
"امروزه",
|
||||
"امسال",
|
||||
"امشب",
|
||||
"امور",
|
||||
"ان",
|
||||
"انجام",
|
||||
"اند",
|
||||
"انشاالله",
|
||||
"انصافا",
|
||||
"انطور",
|
||||
"انقدر",
|
||||
"انها",
|
||||
"انچنان",
|
||||
"انکه",
|
||||
"انگار",
|
||||
"او",
|
||||
"اول",
|
||||
"اولا",
|
||||
"اي",
|
||||
"ايشان",
|
||||
"ايم",
|
||||
"اين",
|
||||
"اينكه",
|
||||
"اکثرا",
|
||||
"اکنون",
|
||||
"اگر",
|
||||
"ای",
|
||||
"ایا",
|
||||
"اید",
|
||||
"ایشان",
|
||||
"ایم",
|
||||
"این",
|
||||
"اینجا",
|
||||
"ایند",
|
||||
"اینطور",
|
||||
"اینقدر",
|
||||
"اینها",
|
||||
"اینچنین",
|
||||
"اینک",
|
||||
"اینکه",
|
||||
"اینگونه",
|
||||
"با",
|
||||
"بار",
|
||||
"بارة",
|
||||
"باره",
|
||||
"بارها",
|
||||
"باز",
|
||||
"بازهم",
|
||||
"باش",
|
||||
"باشد",
|
||||
"باشم",
|
||||
"باشند",
|
||||
"باشيم",
|
||||
"باشی",
|
||||
"باشید",
|
||||
"باشیم",
|
||||
"بالا",
|
||||
"بالاخره",
|
||||
"بالایِ",
|
||||
"بالطبع",
|
||||
"بايد",
|
||||
"باید",
|
||||
"بتوان",
|
||||
"بتواند",
|
||||
"بتوانی",
|
||||
"بتوانیم",
|
||||
"بخش",
|
||||
"بخشی",
|
||||
"بخواه",
|
||||
"بخواهد",
|
||||
"بخواهم",
|
||||
"بخواهند",
|
||||
"بخواهی",
|
||||
"بخواهید",
|
||||
"بخواهیم",
|
||||
"بد",
|
||||
"بدون",
|
||||
"بر",
|
||||
"برابر",
|
||||
"برابرِ",
|
||||
"براحتی",
|
||||
"براساس",
|
||||
"براستی",
|
||||
"براي",
|
||||
"برای",
|
||||
"برایِ",
|
||||
"برخوردار",
|
||||
"برخي",
|
||||
"برخی",
|
||||
"برداري",
|
||||
"برعکس",
|
||||
"بروز",
|
||||
"بزرگ",
|
||||
"بزودی",
|
||||
"بسا",
|
||||
"بسيار",
|
||||
"بسياري",
|
||||
"بسیار",
|
||||
"بسیاری",
|
||||
"بطور",
|
||||
"بعد",
|
||||
"بعدا",
|
||||
"بعدها",
|
||||
"بعری",
|
||||
"بعضا",
|
||||
"بعضي",
|
||||
"بلافاصله",
|
||||
"بلكه",
|
||||
"بله",
|
||||
"بلکه",
|
||||
"بلی",
|
||||
"بنابراين",
|
||||
"بنابراین",
|
||||
"بندي",
|
||||
"به",
|
||||
"بهتر",
|
||||
"بهترين",
|
||||
"بود",
|
||||
"بودم",
|
||||
"بودن",
|
||||
"بودند",
|
||||
"بوده",
|
||||
"بودی",
|
||||
"بودید",
|
||||
"بودیم",
|
||||
"بویژه",
|
||||
"بي",
|
||||
"بيست",
|
||||
"بيش",
|
||||
"بيشتر",
|
||||
"بيشتري",
|
||||
"بين",
|
||||
"بکن",
|
||||
"بکند",
|
||||
"بکنم",
|
||||
"بکنند",
|
||||
"بکنی",
|
||||
"بکنید",
|
||||
"بکنیم",
|
||||
"بگو",
|
||||
"بگوید",
|
||||
"بگویم",
|
||||
"بگویند",
|
||||
"بگویی",
|
||||
"بگویید",
|
||||
"بگوییم",
|
||||
"بگیر",
|
||||
"بگیرد",
|
||||
"بگیرم",
|
||||
"بگیرند",
|
||||
"بگیری",
|
||||
"بگیرید",
|
||||
"بگیریم",
|
||||
"بی",
|
||||
"بیا",
|
||||
"بیاب",
|
||||
"بیابد",
|
||||
"بیابم",
|
||||
"بیابند",
|
||||
"بیابی",
|
||||
"بیابید",
|
||||
"بیابیم",
|
||||
"بیاور",
|
||||
"بیاورد",
|
||||
"بیاورم",
|
||||
"بیاورند",
|
||||
"بیاوری",
|
||||
"بیاورید",
|
||||
"بیاوریم",
|
||||
"بیاید",
|
||||
"بیایم",
|
||||
"بیایند",
|
||||
"بیایی",
|
||||
"بیایید",
|
||||
"بیاییم",
|
||||
"بیرون",
|
||||
"بیرونِ",
|
||||
"بیش",
|
||||
"بیشتر",
|
||||
"بیشتری",
|
||||
"بین",
|
||||
"ت",
|
||||
"تا",
|
||||
"تازه",
|
||||
"تاكنون",
|
||||
"تان",
|
||||
"تاکنون",
|
||||
"تحت",
|
||||
"تر",
|
||||
"تر براساس",
|
||||
"ترين",
|
||||
"تقریبا",
|
||||
"تلویحا",
|
||||
"تمام",
|
||||
"تماما",
|
||||
"تمامي",
|
||||
"تنها",
|
||||
"تو",
|
||||
"تواند",
|
||||
"توانست",
|
||||
"توانستم",
|
||||
"توانستن",
|
||||
"توانستند",
|
||||
"توانسته",
|
||||
"توانستی",
|
||||
"توانستیم",
|
||||
"توانم",
|
||||
"توانند",
|
||||
"توانی",
|
||||
"توانید",
|
||||
"توانیم",
|
||||
"توسط",
|
||||
"تولِ",
|
||||
"تویِ",
|
||||
"ثانیا",
|
||||
"جا",
|
||||
"جاي",
|
||||
"جايي",
|
||||
"جای",
|
||||
"جدا",
|
||||
"جديد",
|
||||
"جدید",
|
||||
"جريان",
|
||||
"جریان",
|
||||
"جز",
|
||||
"جلوگيري",
|
||||
"جلویِ",
|
||||
"جمعا",
|
||||
"جناح",
|
||||
"جهت",
|
||||
"حاضر",
|
||||
"حال",
|
||||
"حالا",
|
||||
"حتما",
|
||||
"حتي",
|
||||
"حتی",
|
||||
"حداکثر",
|
||||
"حدودا",
|
||||
"حدودِ",
|
||||
"حق",
|
||||
"خارجِ",
|
||||
"خب",
|
||||
"خدمات",
|
||||
"خصوصا",
|
||||
"خلاصه",
|
||||
"خواست",
|
||||
"خواستم",
|
||||
"خواستن",
|
||||
"خواستند",
|
||||
"خواسته",
|
||||
"خواستی",
|
||||
"خواستید",
|
||||
"خواستیم",
|
||||
"خواهد",
|
||||
"خواهم",
|
||||
"خواهند",
|
||||
"خواهيم",
|
||||
"خواهی",
|
||||
"خواهید",
|
||||
"خواهیم",
|
||||
"خوب",
|
||||
"خود",
|
||||
"خودت",
|
||||
"خودتان",
|
||||
"خودش",
|
||||
"خودشان",
|
||||
"خودم",
|
||||
"خودمان",
|
||||
"خوشبختانه",
|
||||
"خويش",
|
||||
"خویش",
|
||||
"خویشتن",
|
||||
"خیاه",
|
||||
"خیر",
|
||||
"خیلی",
|
||||
"داد",
|
||||
"دادم",
|
||||
"دادن",
|
||||
"دادند",
|
||||
"داده",
|
||||
"دادی",
|
||||
"دادید",
|
||||
"دادیم",
|
||||
"دار",
|
||||
"دارد",
|
||||
"دارم",
|
||||
"دارند",
|
||||
"داريم",
|
||||
"داری",
|
||||
"دارید",
|
||||
"داریم",
|
||||
"داشت",
|
||||
"داشتم",
|
||||
"داشتن",
|
||||
"داشتند",
|
||||
"داشته",
|
||||
"داشتی",
|
||||
"داشتید",
|
||||
"داشتیم",
|
||||
"دانست",
|
||||
"دانند",
|
||||
"دایم",
|
||||
"دایما",
|
||||
"در",
|
||||
"درباره",
|
||||
"درمجموع",
|
||||
"درون",
|
||||
"دریغ",
|
||||
"دقیقا",
|
||||
"دنبالِ",
|
||||
"ده",
|
||||
"دهد",
|
||||
"دهم",
|
||||
"دهند",
|
||||
"دهی",
|
||||
"دهید",
|
||||
"دهیم",
|
||||
"دو",
|
||||
"دوباره",
|
||||
"دوم",
|
||||
"ديده",
|
||||
"ديروز",
|
||||
"ديگر",
|
||||
"ديگران",
|
||||
"ديگري",
|
||||
"دیر",
|
||||
"دیروز",
|
||||
"دیگر",
|
||||
"دیگران",
|
||||
"دیگری",
|
||||
"را",
|
||||
"راحت",
|
||||
"راسا",
|
||||
"راستی",
|
||||
"راه",
|
||||
"رسما",
|
||||
"رسید",
|
||||
"رفت",
|
||||
"رفته",
|
||||
"رو",
|
||||
"روب",
|
||||
"روز",
|
||||
"روزانه",
|
||||
"روزهاي",
|
||||
"روي",
|
||||
"روی",
|
||||
"رویِ",
|
||||
"ريزي",
|
||||
"زمان",
|
||||
"زمانی",
|
||||
"زمینه",
|
||||
"زود",
|
||||
"زياد",
|
||||
"زير",
|
||||
"زيرا",
|
||||
"زیر",
|
||||
"زیرِ",
|
||||
"سابق",
|
||||
"ساخته",
|
||||
"سازي",
|
||||
"سالانه",
|
||||
"سالیانه",
|
||||
"سایر",
|
||||
"سراسر",
|
||||
"سرانجام",
|
||||
"سریعا",
|
||||
"سریِ",
|
||||
"سعي",
|
||||
"سمتِ",
|
||||
"سوم",
|
||||
"سوي",
|
||||
"سوی",
|
||||
"سویِ",
|
||||
"سپس",
|
||||
"شان",
|
||||
"شايد",
|
||||
"شاید",
|
||||
"شخصا",
|
||||
"شد",
|
||||
"شدم",
|
||||
"شدن",
|
||||
"شدند",
|
||||
"شده",
|
||||
"شدی",
|
||||
"شدید",
|
||||
"شدیدا",
|
||||
"شدیم",
|
||||
"شش",
|
||||
"شش نداشته",
|
||||
"شما",
|
||||
"شناسي",
|
||||
"شود",
|
||||
"شوم",
|
||||
"شوند",
|
||||
"شونده",
|
||||
"شوی",
|
||||
"شوید",
|
||||
"شویم",
|
||||
"صرفا",
|
||||
"صورت",
|
||||
"ضدِّ",
|
||||
"ضدِّ",
|
||||
"ضمن",
|
||||
"طبعا",
|
||||
"طبقِ",
|
||||
"طبیعتا",
|
||||
"طرف",
|
||||
"طريق",
|
||||
"طریق",
|
||||
"طور",
|
||||
"طي",
|
||||
"طی",
|
||||
"ظاهرا",
|
||||
"عدم",
|
||||
"عقبِ",
|
||||
"علّتِ",
|
||||
"علیه",
|
||||
"عمدا",
|
||||
"عمدتا",
|
||||
"عمل",
|
||||
"عملا",
|
||||
"عنوان",
|
||||
"عنوانِ",
|
||||
"غالبا",
|
||||
"غير",
|
||||
"غیر",
|
||||
"فردا",
|
||||
"فعلا",
|
||||
"فقط",
|
||||
"فكر",
|
||||
"فوق",
|
||||
"قابل",
|
||||
"قبل",
|
||||
"قبلا",
|
||||
"قدری",
|
||||
"قصدِ",
|
||||
"قطعا",
|
||||
"كرد",
|
||||
"كردم",
|
||||
"كردن",
|
||||
"كردند",
|
||||
"كرده",
|
||||
"كسي",
|
||||
"كل",
|
||||
"كمتر",
|
||||
"كند",
|
||||
"كنم",
|
||||
"كنند",
|
||||
"كنيد",
|
||||
"كنيم",
|
||||
"كه",
|
||||
"لااقل",
|
||||
"لطفا",
|
||||
"لطفاً",
|
||||
"ما",
|
||||
"مان",
|
||||
"مانند",
|
||||
"مانندِ",
|
||||
"مبادا",
|
||||
"متاسفانه",
|
||||
"متعاقبا",
|
||||
"مثل",
|
||||
"مثلا",
|
||||
"مثلِ",
|
||||
"مجانی",
|
||||
"مجددا",
|
||||
"مجموعا",
|
||||
"مختلف",
|
||||
"مدام",
|
||||
"مدت",
|
||||
"مدّتی",
|
||||
"مردم",
|
||||
"مرسی",
|
||||
"مستقیما",
|
||||
"مسلما",
|
||||
"مطمینا",
|
||||
"معمولا",
|
||||
"مقابل",
|
||||
"ممکن",
|
||||
"من",
|
||||
"موارد",
|
||||
"مورد",
|
||||
"موقتا",
|
||||
"مي",
|
||||
"ميليارد",
|
||||
"ميليون",
|
||||
"مگر",
|
||||
"می",
|
||||
"می شود",
|
||||
"میان",
|
||||
"میرسد",
|
||||
"میرود",
|
||||
"میشود",
|
||||
"میکنیم",
|
||||
"ناشي",
|
||||
"نام",
|
||||
"ناگاه",
|
||||
"ناگهان",
|
||||
"ناگهانی",
|
||||
"نبايد",
|
||||
"نباید",
|
||||
"نبود",
|
||||
"نخست",
|
||||
"نخستين",
|
||||
"نخواهد",
|
||||
"نخواهم",
|
||||
"نخواهند",
|
||||
"نخواهی",
|
||||
"نخواهید",
|
||||
"نخواهیم",
|
||||
"ندارد",
|
||||
"ندارم",
|
||||
"ندارند",
|
||||
"نداری",
|
||||
"ندارید",
|
||||
"نداریم",
|
||||
"نداشت",
|
||||
"نداشتم",
|
||||
"نداشتند",
|
||||
"نداشته",
|
||||
"نداشتی",
|
||||
"نداشتید",
|
||||
"نداشتیم",
|
||||
"نزديك",
|
||||
"نزدِ",
|
||||
"نزدیکِ",
|
||||
"نسبتا",
|
||||
"نشان",
|
||||
"نشده",
|
||||
"نظير",
|
||||
"نظیر",
|
||||
"نكرده",
|
||||
"نمايد",
|
||||
"نمي",
|
||||
"نمی",
|
||||
"نمیشود",
|
||||
"نه",
|
||||
"نهایتا",
|
||||
"نوع",
|
||||
"نوعي",
|
||||
"نوعی",
|
||||
"نيز",
|
||||
"نيست",
|
||||
"نگاه",
|
||||
"نیز",
|
||||
"نیست",
|
||||
"ها",
|
||||
"هاي",
|
||||
"هايي",
|
||||
"های",
|
||||
"هایی",
|
||||
"هبچ",
|
||||
"هر",
|
||||
"هرچه",
|
||||
"هرگز",
|
||||
"هزار",
|
||||
"هست",
|
||||
"هستم",
|
||||
"هستند",
|
||||
"هستيم",
|
||||
"هستی",
|
||||
"هستید",
|
||||
"هستیم",
|
||||
"هفت",
|
||||
"هم",
|
||||
"همان",
|
||||
"همه",
|
||||
"همواره",
|
||||
"همين",
|
||||
"همچنان",
|
||||
"همچنين",
|
||||
"همچنین",
|
||||
"همچون",
|
||||
"همیشه",
|
||||
"همین",
|
||||
"هنوز",
|
||||
"هنگام",
|
||||
"هنگامِ",
|
||||
"هنگامی",
|
||||
"هيچ",
|
||||
"هیچ",
|
||||
"هیچگاه",
|
||||
"و",
|
||||
"واقعا",
|
||||
"واقعی",
|
||||
"وجود",
|
||||
"وسطِ",
|
||||
"وضع",
|
||||
"وقتي",
|
||||
"وقتی",
|
||||
"وقتیکه",
|
||||
"ولی",
|
||||
"وي",
|
||||
"وگو",
|
||||
"وی",
|
||||
"ویژه",
|
||||
"يا",
|
||||
"يابد",
|
||||
"يك",
|
||||
"يكديگر",
|
||||
"يكي",
|
||||
"ّه",
|
||||
"٪",
|
||||
"پارسال",
|
||||
"پاعینِ",
|
||||
"پس",
|
||||
"پنج",
|
||||
"پيش",
|
||||
"پیدا",
|
||||
"پیش",
|
||||
"پیشاپیش",
|
||||
"پیشتر",
|
||||
"پیشِ",
|
||||
"چرا",
|
||||
"چطور",
|
||||
"چقدر",
|
||||
"چنان",
|
||||
"چنانچه",
|
||||
"چنانکه",
|
||||
"چند",
|
||||
"چندین",
|
||||
"چنين",
|
||||
"چنین",
|
||||
"چه",
|
||||
"چهار",
|
||||
"چو",
|
||||
"چون",
|
||||
"چيزي",
|
||||
"چگونه",
|
||||
"چیز",
|
||||
"چیزی",
|
||||
"چیست",
|
||||
"کاش",
|
||||
"کامل",
|
||||
"کاملا",
|
||||
"کتبا",
|
||||
"کجا",
|
||||
"کجاست",
|
||||
"کدام",
|
||||
"کرد",
|
||||
"کردم",
|
||||
"کردن",
|
||||
"کردند",
|
||||
"کرده",
|
||||
"کردی",
|
||||
"کردید",
|
||||
"کردیم",
|
||||
"کس",
|
||||
"کسانی",
|
||||
"کسی",
|
||||
"کل",
|
||||
"کلا",
|
||||
"کم",
|
||||
"کماکان",
|
||||
"کمتر",
|
||||
"کمتری",
|
||||
"کمی",
|
||||
"کن",
|
||||
"کنار",
|
||||
"کنارِ",
|
||||
"کند",
|
||||
"کنم",
|
||||
"کنند",
|
||||
"کننده",
|
||||
"کنون",
|
||||
"کنونی",
|
||||
"کنی",
|
||||
"کنید",
|
||||
"کنیم",
|
||||
"که",
|
||||
"کو",
|
||||
"کَی",
|
||||
"کی",
|
||||
"گاه",
|
||||
"گاهی",
|
||||
"گذاري",
|
||||
"گذاشته",
|
||||
"گذشته",
|
||||
"گردد",
|
||||
"گرفت",
|
||||
"گرفتم",
|
||||
"گرفتن",
|
||||
"گرفتند",
|
||||
"گرفته",
|
||||
"گرفتی",
|
||||
"گرفتید",
|
||||
"گرفتیم",
|
||||
"گروهي",
|
||||
"گفت",
|
||||
"گفتم",
|
||||
"گفتن",
|
||||
"گفتند",
|
||||
"گفته",
|
||||
"گفتی",
|
||||
"گفتید",
|
||||
"گفتیم",
|
||||
"گه",
|
||||
"گهگاه",
|
||||
"گو",
|
||||
"گويد",
|
||||
"گويند",
|
||||
"گویا",
|
||||
"گوید",
|
||||
"گویم",
|
||||
"گویند",
|
||||
"گویی",
|
||||
"گویید",
|
||||
"گوییم",
|
||||
"گيرد",
|
||||
"گيري",
|
||||
"گیرد",
|
||||
"گیرم",
|
||||
"گیرند",
|
||||
"گیری",
|
||||
"گیرید",
|
||||
"گیریم",
|
||||
"ی",
|
||||
"یا",
|
||||
"یابد",
|
||||
"یابم",
|
||||
"یابند",
|
||||
"یابی",
|
||||
"یابید",
|
||||
"یابیم",
|
||||
"یافت",
|
||||
"یافتم",
|
||||
"یافتن",
|
||||
"یافته",
|
||||
"یافتی",
|
||||
"یافتید",
|
||||
"یافتیم",
|
||||
"یعنی",
|
||||
"یقینا",
|
||||
"یه",
|
||||
"یک",
|
||||
"یکی",
|
||||
"۰",
|
||||
"۱",
|
||||
"۲",
|
||||
"۳",
|
||||
"۴",
|
||||
"۵",
|
||||
"۶",
|
||||
"۷",
|
||||
"۸",
|
||||
"۹"
|
||||
]
|
||||
Reference in New Issue
Block a user