Данный материал рассматривает, как читать и записывать данные в файлы на вашем жестком диске. В течение всего обучения вы поймете, что выполнять эти задачи в Python — это очень просто. Начнем же.
Как читать файлы
Python содержит в себе функцию, под названием «open», которую можно использовать для открытия файлов для чтения. Создайте текстовый файл под названием test.txt и впишите:
1 2 3 4 |
This is test file line 2 line 3 this line intentionally left blank |
Вот несколько примеров того, как использовать функцию «открыть» для чтения:
1 2 |
handle = open("test.txt") handle = open(r"C:\Users\mike\py101book\data\test.txt", "r") |
В первом примере мы открываем файл под названием test.txt в режиме «только чтение». Это стандартный режим функции открытия файлов. Обратите внимание на то, что мы не указываем полный путь к файлу в первом примере. Python автоматически посмотрит в папку, в которой запущен скрипт, для test.txt. Если его не удается найти, вы получите уведомление об ошибке IOError. Во втором примере показан полный путь к файлу, но обратите внимание на то, что он начинается с «r». Это значит, что мы указываем Python, чтобы строка обрабатывалась как исходная. Давайте посмотрим на разницу между исходной строкой и обычной:
1 2 3 4 5 |
>>> print("C:\Users\mike\py101book\data\test.txt") C:\Users\mike\py101book\data est.txt >>> print(r"C:\Users\mike\py101book\data\test.txt") C:\Users\mike\py101book\data\test.txt |
Как видно из примера, когда мы не определяем строку как исходную, мы получаем неправильный путь. Почему это происходит? Существуют определенные специальные символы, которые должны быть отображены, такие как “n” или “t”. В нашем случае присутствует “t” (иными словами, табуляция), так что строка добавляет табуляцию в наш путь и портит её для нас. Второй аргумент во втором примере — это буква “r”. Данное значение указывает на то, что мы хотим открыть файл в режиме «только чтение». Иными словами, происходит то же самое, что и в первом примере, но более явно. Теперь давайте, наконец, прочитаем файл!
Введите нижеизложенные строки в скрипт и сохраните его там же, где и файл test.txt.
1 2 3 4 |
handle = open("test.txt", "r") data = handle.read() print(data) handle.close() |
После запуска файл откроется и будет прочитан как строка в переменную data. После этого мы печатаем данные и закрываем дескриптор файла. Следует всегда закрывать дескриптор файла, так как неизвестно, когда и какая именно программа захочет получить к нему доступ. Закрытие файла также поможет сохранить память и избежать появления странных багов в программе. Вы можете указать Python читать строку только раз, чтобы прочитать все строки в списке Python, или прочитать файл по частям. Последняя опция очень полезна, если вы работаете с большими файлами и вам не нужно читать все его содержимое, на что может потребоваться вся память компьютера.
Давайте обратим внимание на различные способы чтения файлов.
1 2 3 4 |
handle = open("test.txt", "r") data = handle.readline() # read just one line print(data) handle.close() |
Если вы используете данный пример, будет прочитана и распечатана только первая строка текстового файла. Это не очень полезно, так что воспользуемся методом readlines() в дескрипторе:
1 2 3 4 |
handle = open("test.txt", "r") data = handle.readlines() # read ALL the lines! print(data) handle.close() |
Есть вопросы по Python?
На нашем форуме вы можете задать любой вопрос и получить ответ от всего нашего сообщества!
Паблик VK
Одно из самых больших сообществ по Python в социальной сети ВК. Видео уроки и книги для вас!
После запуска данного кода вы увидите напечатанный на экране список, так как это именно то, что метод readlines() и выполняет. Далее мы научимся читать файлы по частям.
Как читать файл по частям
Самый простой способ для выполнения этой задачи — использовать цикл. Сначала мы научимся читать файл строку за строкой, после этого мы будем читать по килобайту за раз. В нашем первом примере мы применим цикл:
1 2 3 4 5 6 |
handle = open("test.txt", "r") for line in handle: print(line) handle.close() |
Таким образом, мы открываем файл в дескрипторе в режиме «только чтение», после чего используем цикл для его перебора. Стоит обратить внимание на то, что цикл можно применять к любым объектам Python (строки, списки, множества, ключи в словаре и другие). Весьма просто, не так ли? Попробуем прочитать файл по частям:
1 2 3 4 5 6 7 8 |
handle = open("test.txt", "r") while True: data = handle.read(1024) print(data) if not data: break |
В данном примере мы использовали Python в цикле, пока читали файл по килобайту за раз. Как известно, килобайт содержит в себе 1024 байта или символа. Теперь давайте представим, что мы хотим прочитать двоичный файл, такой как PDF.
Как читать бинарные (двоичные) файлы
Это очень просто. Все, что вам нужно, это изменить способ доступа к файлу:
1 |
handle = open("test.pdf", "rb") |
Мы изменили способ доступа к файлу на rb, что значит read-binary. Стоит отметить, что вам может понадобиться читать бинарные файлы, когда вы загружаете PDF-файлы из интернета или обмениваетесь ими между компьютерами.
Пишем в файлах в Python
Как вы могли догадаться, следуя логике написанного выше, режимы записи файлов в Python — это “w” и “wb” для write-mode и write-binary-mode соответственно. Теперь давайте взглянем на простой пример того, как они применяются.
ВНИМАНИЕ: использование режимов “w” или “wb” в уже существующем файле изменит его без предупреждения. Вы можете проверить, существует ли файл, открыв его при помощи модуля ОС Python.
1 2 3 |
handle = open("output.txt", "w") handle.write("This is a test!") handle.close() |
Вот так вот просто. Все, что мы здесь сделали, — это изменили режим файла на “w” и указали метод записи в файловом дескрипторе, чтобы записать какой-либо текст в файл. Файловый дескриптор также имеет метод writelines() (запись строк), который будет принимать список строк, который дескриптор, в свою очередь, будет записывать по порядку на диск.
Выбирайте дешевые лайки на видео в YouTube на сервисе https://doctorsmm.com/. Здесь, при заказе, вам будет предоставлена возможность подобрать не только недорогую цену, но и выгодные персональные условия приобретения. Торопитесь, пока на сайте действуют оптовые скидки!
Использование оператора «with»
В Python имеется аккуратно встроенный инструмент, применяя который вы можете заметно упростить чтение и редактирование файлов. Оператор with создает диспетчер контекста в Python, который автоматически закрывает файл для вас по окончании работы с ним. Посмотрим, как это работает:
1 2 3 |
with open("test.txt") as file_handler: for line in file_handler: print(line) |
Синтаксис для оператора with на первый взгляд кажется слегка необычным, однако это вопрос недолгой практики. Фактически, все, что мы делаем в данном примере, это:
1 |
handle = open("test.txt") |
Меняем на это:
1 |
with open("test.txt") as file_handler: |
Вы можете выполнять все стандартные операции ввода/вывода в привычном порядке, пока находитесь в пределах блока кода. После того, как вы покинете блок кода, файловый дескриптор закроет его, и его уже нельзя будет использовать. И да, вы все прочли правильно. Вам не нужно лично закрывать дескриптор файла, так как оператор делает это автоматически. Попробуйте внести изменения в примеры, указанные выше, используя оператор with.
Выявление ошибок
Иногда, в ходе работы, ошибки случаются. Файл может быть закрыт, потому что какой-то другой процесс пользуется им в данный момент или из-за наличия той или иной ошибки разрешения. Когда это происходит, может появиться IOError. В данном разделе мы попробуем выявить эти ошибки обычным способом и с применением оператора with. Подсказка: данная идея применима к обоим способам.
1 2 3 4 5 6 7 8 |
try: file_handler = open("test.txt") for line in file_handler: print(line) except IOError: print("An IOError has occurred!") finally: file_handler.close() |
В описанном выше примере мы помещаем обычный код в конструкции try/except. Если ошибка возникнет, следует вывести сообщение на экран. Обратите внимание на то, что следует удостовериться в том, что файл закрыт при помощи оператора finally. Теперь мы готовы взглянуть на то, как мы можем сделать то же самое, пользуясь следующим методом:
1 2 3 4 5 6 |
try: with open("test.txt") as file_handler: for line in file_handler: print(line) except IOError: print("An IOError has occurred!") |
Как вы можете догадаться, мы только что переместили блок with туда же, где и в предыдущем примере. Разница в том, что оператор finally не требуется, так как контекстный диспетчер выполняет его функцию для нас.
Подведем итоги
С этого момента вы уже должны легко работать с файлами в Python. Теперь вы знаете, как читать и вносить записи в файлы двумя способами. Теперь вы сможете с легкостью ориентироваться в данном вопросе.
Являюсь администратором нескольких порталов по обучению языков программирования Python, Golang и Kotlin. В составе небольшой команды единомышленников, мы занимаемся популяризацией языков программирования на русскоязычную аудиторию. Большая часть статей была адаптирована нами на русский язык и распространяется бесплатно.
E-mail: vasile.buldumac@ati.utm.md
Образование
Universitatea Tehnică a Moldovei (utm.md)
- 2014 — 2018 Технический Университет Молдовы, ИТ-Инженер. Тема дипломной работы «Автоматизация покупки и продажи криптовалюты используя технический анализ»
- 2018 — 2020 Технический Университет Молдовы, Магистр, Магистерская диссертация «Идентификация человека в киберпространстве по фотографии лица»