summaryrefslogtreecommitdiff
path: root/day1/task4/task4.py
blob: 0fcf928817084b27b53edaffe34924a085b407a1 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
import string
import re
import os


html_path = os.path.join(os.getcwd(), 'task4_data.html')

if os.access(html_path, os.R_OK):
    with open(html_path) as f:
        data = f.read()

    # Не знаю зачем, но в задании так написано
    try:
        os.mkdir('../htmls')
        os.chdir('../htmls')
    except PermissionError:
        print('Директория на уровень выше не доступна для записи.')
        print('Создаем папку в текущей директории...')
        try:
            os.mkdir('htmls')
        except PermissionError:
            print('Текущая директория не доступна для записи. Завершаем работу...')
            quit()

    cleared_data = ''.join(filter(lambda char: char in string.printable, data))
    with open('ascii_cleared.html', 'w', encoding='utf-8') as f:
        f.write(cleared_data)

    body_cleared = re.sub(
        r'<BODY>(.|\n)*?</BODY>',
        lambda match: match.string[match.start(): match.end()].replace('\n', ''),
        data
    )

    with open('body_cleared.html', 'w', encoding='utf-8') as f:
        f.write(body_cleared)

else:
    print('Файл "{}" не доступен для чтения'.format(html_path))