Нашёл такое на питоне tlj
speech.py экспортирует текст в cvs
speech_inject.py вставляет cvs обратно и создает новые xarc архивы
в speech_inject.py надо поменять кодировку (1255 на 1251, если я правильно понял)
xarc архивы можно распаковать таким QuickBMS скриптом:
в DiaryPages.xrc