Руководство: как сделать нейросетевой/машинный перевод на Gemini

Wiltonicol · 8 марта

Машинный перевод текстов на базе Google Gemini/Deepseek/OpenAI/Google Translate.

Скачать:
Яндекс Диск или Boosty (немного больше информации и видео)

Важно:

Для использования машинного перевода требуется иностранный IP (впн или прокси) и api ключ (у гемини он бесплатный).
Для качественного машинного перевода нужен грамотный промпт.
Для хорошей фильтрации нужно понимание путей/ключей и регулярных выражений.

Планы:
srt/ass/renpy

Скрытый текст

Обновления программы:

22.08.2025
Разные улучшения и фиксы

21.08.2025
Разные улучшения и фиксы

20.08.2025
Улучшен процесс получения и обработки респонса. Была проблема, что в таблицу мог сохраниться “сломанный ответ” (‘’json...).

19.08.2025
Пару фиксов для подсчета токенов и таймаута запросов (300c по умолчанию, можно изменить в конфиг файле), добавлен экспорт/импорт глоссария и пару утилит

17.08.2025
Пару фиксов для редактора промпта

16.08.2025
Google Translate и пару опций для промптов

15.08.2025
Существенное обновление, переработка и улучшение всего

23.03.2025
Существенное обновление (0.8):
а) Изменен интерфейс
б) Добавлены новые пункты в настройках, убраны некоторые другие (topp, topk)
в) Убран gpt4free т.к. выдает очень плохие результаты
г) Добавлена возможность создавать промпты и применять их

19.03.2025
Хотфикс (0.7 (upd)):
а) Добавлена поддержка GPT4o (gpt4free), работает без впн и ключа, но возможна нестабильная работа, а еще реклама в ответе чат бота (все вопросы к gpt4free )

19.03.2025
Обновление (0.7):
а) Добавлен чекбокс включающий повторные запросы и проверку кол-ва строк (по умолчанию выключен).
б) Добавлены экспериментальные модели Gemini

15.03.2025
Обновление (0.6):
а) Добавлен Deepseek (да он платный, но на plati можно купить пополнение аккаунта, и deepseek вроде самый дешевый получается среди других)
б) Слегка изменены стандартные настройки и промпт
в) Небольшие изменения, которые должны положительно сказаться на скорости работы программы и запросов
г) Добавлена возможность использовать прокси вместо впн

14.03.2025
Обновление (0.5):
а) Если кол-во полученных строк от бота не равно отправленному, программа совершает повторные запросы, если после 3 попыток строк все еще меньше/больше, в консоль выводится информация по ошибке (проблемный чанк, кол-во строк (полученных/отправленных) и тд)
б) Если ответ не получен/проблема с соединением/и т.д., программа совершает несколько потвторных запросов, если безрезультатно то в консоль выводится ошибка
в) Добавлен чек бокс чтобы сохранять результат перевода в папку с исходным файлом
г) Мелкие правки текста в консольных ответах
Спасибо @Trevor_!

12.03.2025
Мелкие правки (0.4)

11.03.2025
Существенное обновление (0.3):
а) Полностью переработан код отправки и сохранения текста.
б) Построковый режим убран, можно просто указать 1 строку в соответствующем поле.
в) Из запроса можно исключить строки которые начинаются на определенный символ. Можно указать несколько символов через запятую. Если написать “digits”, то из запроса к боту исключатся все строки с цифрой вначале (к примеру тайминги субтитров).
г) Добавлены настройки чат-бота, выбор модели, пауза между запросами и другие параметры.

09.03.2025
Добавил новый функционал (0.2):
а) Построковый перевод, с возможностью исключать из запроса к боту строки, которые начинаются на определенный символ. Эти строки просто скопируются в итоговый файл без перевода и отправки боту. Также можно исключить из запроса все строки которые начинаются на любую цифру, для этого в поле нужно написать d* (актуально только для 0.2 версии программы).
В конфиг файле есть новый пункт “sleep”, который ограничивает запросы к боту в режиме построкового перевода, по умолчанию 2 (2 секунды между каждым запросом к боту).
б) В обычном режиме перевода добавлена возможность регулировать кол-во строк на запрос к боту (по умолчанию 150)

08.03.2025
Первая версия

Изменено Пятница в 05:25 пользователем Wiltonicol
Обновление программы

allodernat · Понедельник в 16:20

@Wiltonicol внизу проги вроде есть прогресс-бар. Можно его задействовать при открытии файлов? Если скармливаешь большой файл прога словно зависает(не отвечает), в целом на результат это не сказывается, но будет понятно, что прога не зависла, а трудится в поте лица)) Она в принципе часто ловит это состояние ложного зависания при “тяжёлых” действиях)

Например, при работе с 6,5мб файлом, применяет фильтр довольно быстро, а вот если нажать на кнопку “очистить фильтры”. Применился фильтр за 10 сек, снимался 25 сек.

Изменено Понедельник в 17:43 пользователем allodernat

allodernat · Понедельник в 18:00

@Wiltonicol ещё из пожеланий, если я брать уже подготовленные json(txt).

{
    "FilePath": "",
    "itemId": "337",
    "CharacterID": "846f-0",
    "CharacterName": "Рассказчик",
    "Gender": "male",
    "OriginalText": "This is a dream. "
},
{
    "FilePath": "",
    "itemId": "338",
    "CharacterID": "846f-0",
    "CharacterName": "Рассказчик",
    "Gender": "male",
    "OriginalText": "A dream about how I survived. "
},
{
    "FilePath": "",
    "itemId": "344",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "Yo, look who's awake. "
},
{
    "FilePath": "",
    "itemId": "347",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "You had a heatstroke and you were out cold for 3 days. "
},
{
    "FilePath": "",
    "itemId": "348",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "We thought you were dead. Didn't think you could pull through. "
},
{
    "FilePath": "",
    "itemId": "349",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "You look more than just awful. Had a nightmare?"
},
{
    "FilePath": "",
    "itemId": "353",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "It could be your life flashing before your eyes. Tough bastard. "
}

Скажем такой текст, можно ли это реализовать, чтобы можно было привязывать к “исходному тексту” разные параметры, для понимания ИИ, чтобы шла склейка "CharacterName" + "Gender" + "OriginalText" из которых "CharacterName" + "Gender" для привязки текста к имени и гендеру, чтобы было лучше понимания ИИ контекста. Ну и прописывать их в промте.

И ещё касательно глоссария для перевода, опустим, что туда неплохо было добавить “Персонаж — гендер”) В том виде в котором он не очень удобен для вноса, было бы не плохо, чтобы можно было бы его импортировать/экспортировать(ini/json/txt), без разницы, главное не вводить потаблично, это может превратиться в пытку) Но его наличие плюс)

Изменено Понедельник в 18:18 пользователем allodernat

Mr_GaNjA · Понедельник в 22:13

Можно-ли подключить локальные LLM Нейронки не облачные через Ollama.API? Допустим у меня уже крутится на машине локальный DeepSeek 32b Q5_k_m и еще свободных мощностей ПК хватает что-бы браузить или видео смотреть преспокойно. По типу SillyTavern (у меня оная полностью локальная и локализованная — хотя многие обыватели пользуют только через облака)

Wiltonicol · Вторник в 04:34

6 часов назад, Mr_GaNjA сказал:

Можно-ли подключить локальные LLM Нейронки не облачные через Ollama.API? Допустим у меня уже крутится на машине локальный DeepSeek 32b Q5_k_m и еще свободных мощностей ПК хватает что-бы браузить или видео смотреть преспокойно. По типу SillyTavern (у меня оная полностью локальная и локализованная — хотя многие обыватели пользуют только через облака)

Если честно никогда не имел опыта с этим, отпишу в лс

Изменено Вторник в 04:34 пользователем Wiltonicol

allodernat · Вторник в 08:01

@Mr_GaNjA Пробовал deepseek через LLM, результат был сильно хуже облачной, как по качеству, так и по производительности.

Mr_GaNjA · Вторник в 16:06

8 hours ago, allodernat said:

@Mr_GaNjA Пробовал deepseek через LLM, результат был сильно хуже облачной, как по качеству, так и по производительности.

Тут от количества миллиарда параметров зависит и квантовки! Мои 32b не каждый потянет. Обычные потребители даже не пытаются заходить выше уровня в 12b или 14b там конечно результат не ахти будет. С 20b уже другая лига начинается, но и видеопамяти с оперативой вагон уже нужно. Плюс у меня установленны не DeepSeek единый, а еще:

Gemma3:27b Q8_K_M (Семейство Google Gemeni)

QWEN3_32b_Q5_K_M (Кодерные Китайцы)

Nourse Capibara 34b Q5_K_M (Писательные Китайцы)

Изменено Вторник в 16:20 пользователем Mr_GaNjA

Mr_GaNjA · Вторник в 16:51

Как сами Google утверждают их локальная Gemma 3 27b побила облачный DeepSeek R1 на 671b (параметров) в диалогах. Может имеет смысл использовать именно её!

Изменено Вторник в 16:58 пользователем Mr_GaNjA
Неточности

Dementei · вчера в 07:49

@Wiltonicol Доброе утро.

А можно как-то сохранить настройки для перевода?

Ввел в исключение #*
А мне все равно все строки перевело с #.

Также создается json файл со своим форматированием, а у меня был обычный txt. Результат надо потом самому обработать, чтобы получить нужное форматирование? Также в json пропали все пустые переносы строк.
{7647}{}{Ооо, моя нога} # target hit in left leg
# target hit in left leg

Вот чтобы не трогал текст в таких случаях с #, какое исключение надо прописать?

Что такое маска пути?

В глоссарии должен быть просто текст Английский термин пробел Русский термин?
Можно ли указать еще как минимум пол персонажа?

Где можно посмотреть пример промта для перевода?

У меня сейчас месячный пробный Gemini, когда подписка закончится, то будут по API доступны flash и pro модели? Какую из трех моделей Гмини ты советуешь использовать?

И я так понял только у Гугла API бесплатное, у ЧАТ ГПТ и ДИПСИКА платное. Так?

Когда запускается приложение, то сортировка строк с конца, можно ли как-то с начала сделать?
Спасибо.

Wiltonicol · вчера в 09:52

2 часа назад, Dementei сказал:

@Wiltonicol Доброе утро.

А можно как-то сохранить настройки для перевода?

Ввел в исключение #*
А мне все равно все строки перевело с #.

Также создается json файл со своим форматированием, а у меня был обычный txt. Результат надо потом самому обработать, чтобы получить нужное форматирование? Также в json пропали все пустые переносы строк.
{7647}{}{Ооо, моя нога} # target hit in left leg
# target hit in left leg

Вот чтобы не трогал текст в таких случаях с #, какое исключение надо прописать?

Что такое маска пути?

В глоссарии должен быть просто текст Английский термин пробел Русский термин?
Можно ли указать еще как минимум пол персонажа?

Где можно посмотреть пример промта для перевода?

У меня сейчас месячный пробный Gemini, когда подписка закончится, то будут по API доступны flash и pro модели? Какую из трех моделей Гмини ты советуешь использовать?

И я так понял только у Гугла API бесплатное, у ЧАТ ГПТ и ДИПСИКА платное. Так?

Когда запускается приложение, то сортировка строк с конца, можно ли как-то с начала сделать?
Спасибо.

Развернуто на всё ответил в ЛС

Dementei · вчера в 11:01

@Wiltonicol Спасибо.
Промежуточный (не всего файла) перевод можно интегрировать?
Чтобы проверить как это будет выглядеть.

Лимит токенов и строк. Так что главнее? Не понятно…

Так же, я как понимаю, такими кусками будет отправляться текст на перевод. А у Гмини есть же предел какой-то, тем более на бесплатное API? Сейчас можно остановить перевод кнопкой и продолжить его если включена галка “Пропускать уже переведенные”. Так?

И самое главное, Глоссарий это хорошо, но как быть с одинаковыми предложениями, которых в тексте может быть много. Они переведутся по разному?

allodernat · вчера в 11:15

@Dementei

15 минут назад, Dementei сказал:

Лимит токенов и строк. Так что главнее? Не понятно…

Если заданное количество строк не влезет в лимит токенов, то строк отправиться меньше.

А если лимит токенов задан с запасом, то строк всё равно отправиться заданное количество. Лимит токенов не только для строк, он охватывает также промт и глоссарий.

Пол персонажей можете прописывать в самом промте.

15 минут назад, Dementei сказал:

Сейчас можно остановить перевод кнопкой и продолжить его если включена галка “Пропускать уже переведенные”.

Да, если не нажата, то пойдёт по кругу.

15 минут назад, Dementei сказал:

И самое главное, Глоссарий это хорошо, но как быть с одинаковыми предложениями, которых в тексте может быть много. Они переведутся по разному?

Через апи здесь новая отправка это грубо говоря новый чат через гемини, так что да, если в промте не отображены эти одинаковые предложения, то они могут быть переведены по разному с каждым новым чанком. В теории можно сделать через апи аналог чата, то память потребляет токены и когда условно(в бесплатном режиме) вы преодолеваете 200-300к токенов может начать делать критические ошибки. Одинаковые предложения вы можете вытащить из своего файла и перевести отдельно. Вообще для перевода желательно уметь быстро писать скрипты на том же питоне под разные задачи, ии в помощь.

3 часа назад, Dementei сказал:

У меня сейчас месячный пробный Gemini,

Если какой-нибудь премиум или про, то может лучше перевести через вэбчат, он более гибкий, ему можно скармливать в теории большие тексты(если у вас про/премиум) и в пределах чата он должен одинаково переводить.

Изменено вчера в 11:17 пользователем allodernat

Dementei · вчера в 11:26

@Wiltonicol
Интересно пока через API.
Т.е. если очень большой Глоссарий и Промт, но он может не влезть в лимиты? Т.е. с каждым новым чанком отправляется и Промт и Глоссарий?

А с бесплатным ключем правда доступны 2,5 pro, 2,5 flash, 2,5 flash lite? Или это названия в интерфейсе, а на самом деле другие какие ИИ используются?

Одинаковые предложения можно найти заранее в файле и составить их список и место и отправлять один раз… как-то так.

allodernat · вчера в 11:31

36 минут назад, Dementei сказал:

Т.е. если очень большой Глоссарий и Промт, но он может не влезть в лимиты? Т.е. с каждым новым чанком отправляется и Промт и Глоссарий?

Скажем у вас промт 4к токенов, ограничение 5к токенов, строк поставили 300. Из них к примеру отправится только 50 строк.

36 минут назад, Dementei сказал:

А с бесплатным ключем правда доступны 2,5 pro, 2,5 flash, 2,5 flash lite? Или это названия в интерфейсе, а на самом деле другие какие ИИ используются?

Доступны, кроме про, он более лимитирован. Сколько-то вы конечно обработаете, но потом он вам выдаст, что суточный лимит истёк приходите завтра.

36 минут назад, Dementei сказал:

Одинаковые предложения можно найти заранее в файле и составить их список и место и отправлять один раз… как-то так.

Если они одинаковые, достаточно отправить одно предложение а дальше cntrlC/cntrlV))

Изменено вчера в 12:03 пользователем allodernat

Dementei · вчера в 11:56

@allodernat Спасибо.

@Wiltonicol А как реализована работа с Глоссарием?
Мне Гемини говорит, что не умеет работать с Глоссарием по API.
Он вставляется в Промт каждый раз?

Wiltonicol · вчера в 12:12

15 минут назад, Dementei сказал:

@allodernat Спасибо.

@Wiltonicol А как реализована работа с Глоссарием?
Мне Гемини говорит, что не умеет работать с Глоссарием по API.
Он вставляется в Промт каждый раз?

Да, встраивается в запрос (промпт)

Руководство: как сделать нейросетевой/машинный перевод на Gemini

Рекомендованные сообщения

Wiltonicol 98

Поделиться сообщением

Ссылка на сообщение

allodernat 22

Поделиться сообщением

Ссылка на сообщение

allodernat 22

Поделиться сообщением

Ссылка на сообщение

Mr_GaNjA 0

Поделиться сообщением

Ссылка на сообщение

Wiltonicol 98

Поделиться сообщением

Ссылка на сообщение

allodernat 22

Поделиться сообщением

Ссылка на сообщение

Mr_GaNjA 0

Поделиться сообщением

Ссылка на сообщение

Mr_GaNjA 0

Поделиться сообщением

Ссылка на сообщение

Dementei 1

Поделиться сообщением

Ссылка на сообщение

Wiltonicol 98

Поделиться сообщением

Ссылка на сообщение

Dementei 1

Поделиться сообщением

Ссылка на сообщение

allodernat 22

Поделиться сообщением

Ссылка на сообщение

Dementei 1

Поделиться сообщением

Ссылка на сообщение

allodernat 22

Поделиться сообщением

Ссылка на сообщение

Dementei 1

Поделиться сообщением

Ссылка на сообщение

Wiltonicol 98

Поделиться сообщением

Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Создать аккаунт

Войти

Сейчас популярно

Продвигаемые темы

Последние сообщения

Изменения статусов

Лучшие авторы

ZoneOfGames.ru

Активность

Русификаторы

Новости

Статьи

Форум