Перейти к содержимому
Zone of Games Forum
shikulja

Форсировать кодировку отдельных строк в .txt

Рекомендованные сообщения

Часть строк нужно форсировать, в .txt

то есть кодировка в utf8 , нужно некоторые строки еще раз перекодировать в utf8 как 1251 

должно получится так: РІРµСЂРЅС‘тся! Прыгаем!

нужно максимально просто, чтобы прописать номера строк, и указать входной выходной файл

Изменено пользователем shikulja

Поделиться сообщением


Ссылка на сообщение

Насколько я понял нужно указанные строчки в UTF-8 файле преобразовать в кодировку Windows-1251 и записать обратно в файл как UTF-8.

Ссылка на программу: zog_re-encoder_v01

Подробности в readme файле.

 

P.S. Для преобразования индивидуальных строк можно использовать эту программку: CyrillicConverter

  • +1 1

Поделиться сообщением


Ссылка на сообщение
В 27.03.2020 в 03:03, adm-244 сказал:

Насколько я понял нужно указанные строчки в UTF-8 файле преобразовать в кодировку Windows-1251 и записать обратно в файл как UTF-8.

Ссылка на программу: zog_re-encoder_v01

Подробности в readme файле.

 

P.S. Для преобразования индивидуальных строк можно использовать эту программку: CyrillicConverter

то что надо. zog_re-encoder_v01

 можно ли натравить на весь файл?

можно ли указать последовательность строк, например 1000-1100,1350-1400

и хорошо бы не указывать выходной файл. сохранять в текущий если не указан

 

затачивал под  

iconv -c -f cp1251 -t UTF-8 который портачил некоторые символы

recode -f -t  windows-1251..UTF-8 script_forced.txt (тоже портачит)

enconv не захотел вообще понимать что от него нужно, впрочем как и бугры обычно впадают в ступор)

остальные только гуишные нормально работали

Изменено пользователем shikulja

Поделиться сообщением


Ссылка на сообщение

recode

�зменение скорости появления текста.

�?зменение скорости появления текста.

 

iconv

Рзменение скорости появления текста.

�зменение скорости появления текста.

 

zog_recorder  (win)

Рзменение скорости появления текста.

Изменение скорости появления текста.

 

Интересно что с ними не так.

Изменено пользователем shikulja

Поделиться сообщением


Ссылка на сообщение

Добавил поддержку промежутков для задания последовательности строк (например, 1000-1100).

Также сделал выходной файл не обязательным параметром. Если он не указан, то запись осуществляется во входной файл.

Ссылка: zog_re-encoder_v02

 

Насчет неправильной конвертации у представленных программ. Проблема заключается в том, что некоторые символы Windows-1251 закодированные как UTF-8 являются, так называемыми, “управляющими символами” и многими текстовыми редакторами игнорируются или заменяются на другие. Отсюда и “пропажа” символов.

  • +1 1

Поделиться сообщением


Ссылка на сообщение
2 часа назад, adm-244 сказал:

Добавил поддержку промежутков для задания последовательности строк (например, 1000-1100).

Также сделал выходной файл не обязательным параметром. Если он не указан, то запись осуществляется во входной файл.

Ссылка: zog_re-encoder_v02

 

Насчет неправильной конвертации у представленных программ. Проблема заключается в том, что некоторые символы Windows-1251 закодированные как UTF-8 являются, так называемыми, “управляющими символами” и многими текстовыми редакторами игнорируются или заменяются на другие. Отсюда и “пропажа” символов.

классно, теперь разгуляюсь. спасибо.

я думал на счет этого, вроде бы для этого есть /translit но он или не заработал, или вообще не так работает, и только в одной из них

@adm-244 

в следующих версиях если вдруг будет желание добавить 

удаление пустых строчек (убрать форматирование notabenoid),

удаление строк с заданным текстом (хедеры html, копирайты ноты)

простую авто-замену из текстового файла, ну как и сейчас из тхт.

замену определенных строк на заданный текст  (чтобы возвращать некоторые переменные, если вдруг потрутся, и не лезть в блокноты и пр.)

все это есть, вполне тривиально, но где-то это просто в блокнот лезть, где-то батник, и в итоге каша.

Изменено пользователем shikulja

Поделиться сообщением


Ссылка на сообщение

@adm-244  проверил работает, замена  последовательности строк отлично

не работает замена во всем файле если не указан <файл с номерами строк> или пустой файл.

при перезаписи файла спрашивает, ключ  /Y не работает

не работают маски *.txt для входного файла, если нет выходного файла (оборачивать for %%f in ( *.txt) ) неудобно, и не для всех.

 

 

 

 

@adm-244 

в будущем можно добавить

- рекурсивную обработку строк (мне не нужно, но может пригодится.)

- удаление каждой второй, третьей или % строки (при импорте с ноты с несколькими вариантами перевода, можно ненужные выпилить, не идеально, но и такое щас еще поискать надо как сделать с помощью регулярок в блокноте, да и неудобно)

можно объединить с удалением пустых строчек.

Изменено пользователем shikulja

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас



Zone of Games © 2003–2024 | Реклама на сайте.

×