0
0 комментариев

Необходимо обрабатывать русскоязычный текст(ы) большого объёма. Насколько я разобрался в данном вопросе, при работе с помощью библиотеки nltk весь текст надо переводить в байтовые строки.

Подскажите примерный алгоритм при условии, что сначала весь текст хранится в текстовых файлах, после чего его надо разбить на предложения и занести в БД (keychain)?


Добавить комментарий