Исправьте историческое правописание

Timat спросил: 03 ноября 2018 в 09:17 в: python

Привет всем, я публикую это сообщение впервые. Я пишу скрипт на Python для создания программы, которая будет возвращать стандартную форму слов. Я основываюсь на правилах для преобразования исторического текста (нормализация орфографии). Здесь код не работает должным образом. Он просто отображает измененное слово, но не весь файл. Пожалуйста, я прошу идеи о том, как решить.

import re, string, unicodedata
from nltk.corpus import stopwords
import spacy
import codecsnlp = spacy.load('fr')
with codecs.open(r'/home/m16/fatkab/RD_project/corpus.txt', encoding='utf8')as f:
    word =f.read()
    tokens = re.split(r'\W+', word)
    print (tokens)for word in tokens:
    rule1 = word.replace('y', 'i')    # to avoid modifying y as a word itself:
    if word.endswith ('y')and len(word) >= 2:
        print(rule1)

мой пример ввода: или просто проследуйте, просто сделайте это без всяких сомнений. © : n'est ce pas raison que noussoyons du tout siens? И все же, кто является главным жрецом, у которого есть наследие сыновей, или же вы знаете, что такое? Он должен быть благоразумным, неосмотрительным, уничижительным и унифицированным для учения, как и мое. И месье quelle authoritemeritoit la Loy, qui estoit ainsi approuuee partant de miracles? Car Dieu ne commande pas simplementâ € Мой член Парламента, Апре-ла-Шуарский сын Пророк: Магистраль в Монтане, Иль-ле-Сепар-де-ла-Компаньон, Афин-квикванд и иль-вендра-метен-ан-оант-ла-Лой, ку'и летиен ком ком анж, & неточечное коммьюнити мортель.

здесь вывод

lui
lui
lui
ai
oui
Loi
lui
foi
Loi
hui
soi
lui
lui
lui
ci
Loi
soi
lui
ai
lui
lui
doi
quoi
soi
ai
lui
lui
soi
# the language is French

0 ответов