Аннотации:
Выборка текстов на заданную тематику является одной из основных подготовительных задач в исследовательских проектах в рамках сравнительно-исторического, типологического и сопоставительного языкознания. Ручная выборка текстов требует больших затрат по времени и не всегда отличается эффективностью. Работа с текстами на восточных языках отличается особой трудоемкостью. После того как появилась возможность оцифровки больших корпусов текстов, возникло множество прикладных утилит, использующих достижения современной информатики. Процедурное знание по применению этих утилит повышает эффективность работы исследователя. В статье содержатся процедурные знания по использованию утилиты baidubaike, основанной на возможностях языка Python и предназначенной для автоматизированной выборки текстовых коллекций по китайскому языку из сетевой энциклопедии Baidu.