# | |
# This file defines a stopword set for Japanese. | |
# | |
# This set is made up of hand-picked frequent terms from segmented Japanese Wikipedia. | |
# Punctuation characters and frequent kanji have mostly been left out. See LUCENE-3745 | |
# for frequency lists, etc. that can be useful for making your own set (if desired) | |
# | |
# Note that there is an overlap between these stopwords and the terms stopped when used | |
# in combination with the JapanesePartOfSpeechStopFilter. When editing this file, note | |
# that comments are not allowed on the same line as stopwords. | |
# | |
# Also note that stopping is done in a case-insensitive manner. Change your StopFilter | |
# configuration if you need case-sensitive stopping. Lastly, note that stopping is done | |
# using the same character width as the entries in this file. Since this StopFilter is | |
# normally done after a CJKWidthFilter in your chain, you would usually want your romaji | |
# entries to be in half-width and your kana entries to be in full-width. | |
# | |
の | |
に | |
は | |
を | |
た | |
が | |
で | |
て | |
と | |
し | |
れ | |
さ | |
ある | |
いる | |
も | |
する | |
から | |
な | |
こと | |
として | |
い | |
や | |
れる | |
など | |
なっ | |
ない | |
この | |
ため | |
その | |
あっ | |
よう | |
また | |
もの | |
という | |
あり | |
まで | |
られ | |
なる | |
へ | |
か | |
だ | |
これ | |
によって | |
により | |
おり | |
より | |
による | |
ず | |
なり | |
られる | |
において | |
ば | |
なかっ | |
なく | |
しかし | |
について | |
せ | |
だっ | |
その後 | |
できる | |
それ | |
う | |
ので | |
なお | |
のみ | |
でき | |
き | |
つ | |
における | |
および | |
いう | |
さらに | |
でも | |
ら | |
たり | |
その他 | |
に関する | |
たち | |
ます | |
ん | |
なら | |
に対して | |
特に | |
せる | |
及び | |
これら | |
とき | |
では | |
にて | |
ほか | |
ながら | |
うち | |
そして | |
とともに | |
ただし | |
かつて | |
それぞれ | |
または | |
お | |
ほど | |
ものの | |
に対する | |
ほとんど | |
と共に | |
といった | |
です | |
とも | |
ところ | |
ここ | |
##### End of file |