blob: 0fcf928817084b27b53edaffe34924a085b407a1 (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
|
import string
import re
import os
html_path = os.path.join(os.getcwd(), 'task4_data.html')
if os.access(html_path, os.R_OK):
with open(html_path) as f:
data = f.read()
# Не знаю зачем, но в задании так написано
try:
os.mkdir('../htmls')
os.chdir('../htmls')
except PermissionError:
print('Директория на уровень выше не доступна для записи.')
print('Создаем папку в текущей директории...')
try:
os.mkdir('htmls')
except PermissionError:
print('Текущая директория не доступна для записи. Завершаем работу...')
quit()
cleared_data = ''.join(filter(lambda char: char in string.printable, data))
with open('ascii_cleared.html', 'w', encoding='utf-8') as f:
f.write(cleared_data)
body_cleared = re.sub(
r'<BODY>(.|\n)*?</BODY>',
lambda match: match.string[match.start(): match.end()].replace('\n', ''),
data
)
with open('body_cleared.html', 'w', encoding='utf-8') as f:
f.write(body_cleared)
else:
print('Файл "{}" не доступен для чтения'.format(html_path))
|