На втором занятии мы продолжим обсуждать, какие сложности представляет естественный язык для обработки: от омонимии, про которую говорилось на первом занятии (т. е. случаев, когда одно и то же слово значит разные вещи), мы перейдём к синонимии — ситуации, когда, наоборот, один и тот же объект обозначается разными словами ("президент США", "Дональд Трамп", "американский лидер"). Во второй части занятия мы изучим самый распространённый инструмент для поиска шаблонов в строках — регулярные выражения, научимся выделять в тексте e-mail'ы и телефоны и поймём, как это поможет нам делить текст на слова.