Андреев А.М., Березкин Д.В., Симаков К.В.
НПЦ "ИНТЕЛТЕК ПЛЮС" E-mail:
arka@inteltec.ru
Обучение морфологического анализатора на большой электронной коллекции
текстовых документов
В статье изложен метод и алгоритм обучения морфологического анализатора на основе большого текстового массива.
В качестве учителя при обучении выступает морфологический анализатор словарного типа. Основная особенность
обученного анализатора - способность выполнять разбор неизвестных слов. Проведен ряд экспериментов по оценке
свойств алгоритма обучения, в частности свойства обобщения. Приведено сравнение работы обученного анализатора
с анализатором словарного типа.
|