Для изменения кодировки CSV файла на UTF-8 в Python можно использовать следующий код:
«`python
import csv
import codecs
# Открываем файл в режиме чтения с текущей кодировкой
with codecs. open(‘your_file. csv’, ‘r’, encoding=’текущая_кодировка’) as file:
# Читаем содержимое CSV файла
lines = file. read
# Открываем файл в режиме записи с новой кодировкой (UTF-8)
with codecs. open(‘your_file_utf8.csv’, ‘w’, encoding=’utf-8′) as new_file:
# Записываем содержимое CSV файла с новой кодировкой
new_file. write(lines)
print(Кодировка файла успешно изменена на UTF-8.)
«`
В данном примере замените `’your_file. csv’` на путь к вашему CSV файлу и `’текущая_кодировка’` на текущую кодировку вашего файла (например, `’utf-8’`, `’cp1251’`, `’iso-8859-1’` и т. д.).
Таким образом, программа откроет файл с указанной кодировкой, прочитает его содержимое, а затем создаст новый файл с кодировкой UTF-8 и запишет в него ранее прочитанные данные. Когда программа завершит свою работу, в папке с программой появится новый файл с названием `’your_file_utf8.csv’`, представляющий собой исходный файл в кодировке UTF-8.
Обратите внимание, что кодировка должна корректно соответствовать содержимому CSV файла, иначе данные могут быть искажены при перекодировании. Также убедитесь, что у вас установлен модуль `codecs`, который обычно входит в стандартную библиотеку Python.