Лингвистические корпуса и их количественный анализ

Архив. Мы больше не анонсируем данное мероприятие. Возможно информация полностью устарела. Что там дальше мы не знаем.

Зовём на лекцию

Организатор:

Культурно-просветительский центр "Архэ"

Когда?

с 25 октября 2017

Город

Москва

Где?

Центр АРХЭ. В здании Физического факультета МПГУ (бывш. МПГИ им. Ленина), ул. Малая Пироговская, д.29.

Метро

Спортивная

Сайт:

arhe.msk.ru

Контакты:

По всем вопросам звоните по телефону: 8-495-088-92-81 или пишите на почту: arhe.msk@gmail.com

Условия участия:

Стоимость участия: 500 руб.

Бо́льшая часть компьютерно-лингвистических приложений сейчас опирается на большие массивы собранных текстов — лингвистические корпуса. Некоторые из них, например Национальный корпус русского языка (www.ruscorpora.ru), доступны для онлайн-поиска и позволяют также получать результаты, интересные и с точки зрения традиционной, некомпьютерной лингвистики. На занятии мы поговорим о том, как устроены такие большие собрания текстов и какими количественными свойствами они обладают: например, чем частотное распределение слов в корпусах похоже на численность населения городов и почему большинство слов в любом корпусе, какой бы мы ни взяли, встречаются только один раз.