Контекст

Русскоязычный Twitter обошел литературу по актуальности контекста

imagest.jpg

Николай Васильев, разработчик из итальянской компании SpazioDati, проследил, насколько русский сегмент Twitter подходит в качестве основы для базы семантических векторов: количественных представлений слов, описывающих их контекстное значение. Оказалось, что даже сравнительно короткие выборки твитов не намного уступают более крупным корпусам данных (архивам книг или Википедии), однако при этом Twitter позволяет уловить наиболее актуальные контексты, зачастую недоступные более статичным базам текстов. Препринт исследования выложен на arXiv.org.

RSS-материал