Перейти к содержимому
Zone of Games Forum
Wiltonicol

Руководство: как сделать нейросетевой/машинный перевод на Gemini

Рекомендованные сообщения

@Wiltonicol внизу проги вроде есть прогресс-бар. Можно его задействовать при открытии файлов? Если скармливаешь большой файл прога словно зависает(не отвечает), в целом на результат это не сказывается, но  будет понятно, что прога не зависла, а трудится в поте лица)) Она в принципе часто ловит это состояние ложного зависания при “тяжёлых” действиях)

Например, при работе с 6,5мб файлом, применяет фильтр довольно быстро, а вот если нажать на кнопку “очистить фильтры”. Применился фильтр за 10 сек, снимался 25 сек.

gAd7087AMM.jpg

Изменено пользователем allodernat
  • +1 1

Поделиться сообщением


Ссылка на сообщение

@Wiltonicol ещё из пожеланий, если я брать уже подготовленные json(txt).

{
    "FilePath": "",
    "itemId": "337",
    "CharacterID": "846f-0",
    "CharacterName": "Рассказчик",
    "Gender": "male",
    "OriginalText": "This is a dream. "
},
{
    "FilePath": "",
    "itemId": "338",
    "CharacterID": "846f-0",
    "CharacterName": "Рассказчик",
    "Gender": "male",
    "OriginalText": "A dream about how I survived. "
},
{
    "FilePath": "",
    "itemId": "344",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "Yo, look who's awake. "
},
{
    "FilePath": "",
    "itemId": "347",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "You had a heatstroke and you were out cold for 3 days. "
},
{
    "FilePath": "",
    "itemId": "348",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "We thought you were dead. Didn't think you could pull through. "
},
{
    "FilePath": "",
    "itemId": "349",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "You look more than just awful. Had a nightmare?"
},
{
    "FilePath": "",
    "itemId": "353",
    "CharacterID": "846f-6532",
    "CharacterName": "Заключённый",
    "Gender": "male",
    "OriginalText": "It could be your life flashing before your eyes. Tough bastard. "
}

Скажем такой текст, можно ли это реализовать, чтобы можно было привязывать к “исходному тексту” разные параметры, для понимания ИИ, чтобы шла склейка "CharacterName" + "Gender" + "OriginalText" из которых "CharacterName" + "Gender" для привязки текста к имени и гендеру, чтобы было лучше понимания ИИ контекста. Ну и прописывать их в промте.

И ещё касательно глоссария для перевода, опустим, что туда неплохо было добавить “Персонаж — гендер”) В том виде в котором он не очень удобен для вноса, было бы не плохо, чтобы можно было бы его импортировать/экспортировать(ini/json/txt), без разницы, главное не вводить потаблично, это может превратиться в пытку) Но его наличие плюс)

Изменено пользователем allodernat
  • В замешательстве (0) 1

Поделиться сообщением


Ссылка на сообщение

Можно-ли подключить локальные LLM Нейронки не облачные через Ollama.API? Допустим у меня уже крутится на машине локальный DeepSeek 32b Q5_k_m и еще свободных мощностей ПК хватает что-бы браузить или видео смотреть преспокойно. По типу SillyTavern (у меня оная полностью локальная и локализованная  — хотя многие обыватели пользуют только через облака)

Поделиться сообщением


Ссылка на сообщение
6 часов назад, Mr_GaNjA сказал:

Можно-ли подключить локальные LLM Нейронки не облачные через Ollama.API? Допустим у меня уже крутится на машине локальный DeepSeek 32b Q5_k_m и еще свободных мощностей ПК хватает что-бы браузить или видео смотреть преспокойно. По типу SillyTavern (у меня оная полностью локальная и локализованная  — хотя многие обыватели пользуют только через облака)

Если честно никогда не имел опыта с этим, отпишу в лс

Изменено пользователем Wiltonicol

Поделиться сообщением


Ссылка на сообщение

@Mr_GaNjA Пробовал deepseek через LLM, результат был сильно хуже облачной, как по качеству, так и по производительности.

Поделиться сообщением


Ссылка на сообщение
8 hours ago, allodernat said:

@Mr_GaNjA Пробовал deepseek через LLM, результат был сильно хуже облачной, как по качеству, так и по производительности.

Тут от количества миллиарда параметров зависит и квантовки! Мои 32b не каждый потянет. Обычные потребители даже не пытаются заходить выше уровня в 12b или 14b там конечно результат не ахти будет. С 20b уже другая лига начинается, но и видеопамяти с оперативой вагон уже нужно. Плюс у меня установленны не DeepSeek единый, а еще:

Gemma3:27b Q8_K_M (Семейство Google Gemeni)

QWEN3_32b_Q5_K_M (Кодерные Китайцы)

Nourse Capibara 34b Q5_K_M (Писательные Китайцы)

 

Изменено пользователем Mr_GaNjA

Поделиться сообщением


Ссылка на сообщение

Как сами Google утверждают их локальная Gemma 3 27b побила облачный DeepSeek R1 на 671b (параметров) в диалогах. Может имеет смысл использовать именно её!

Изменено пользователем Mr_GaNjA
Неточности

Поделиться сообщением


Ссылка на сообщение

@Wiltonicol Доброе утро.

А можно как-то сохранить настройки для перевода?

Ввел в исключение #*
А мне все равно все строки перевело с #.

Также создается json файл со своим форматированием, а у меня был обычный txt. Результат надо потом самому обработать, чтобы получить нужное форматирование? Также в  json пропали все пустые переносы строк.
{7647}{}{Ооо, моя нога} # target hit in left leg
# target hit in left leg

Вот чтобы не трогал текст в таких случаях с #, какое исключение надо прописать?

Что такое маска пути?

В глоссарии должен быть просто текст Английский термин пробел Русский термин?
Можно ли указать еще как минимум пол персонажа?

Где можно посмотреть пример промта для перевода?

У меня сейчас месячный пробный Gemini, когда подписка закончится, то будут по API доступны flash и pro модели? Какую из трех моделей Гмини ты советуешь использовать?

И я так понял только у Гугла API бесплатное,  у ЧАТ ГПТ и ДИПСИКА платное. Так?

Когда запускается приложение, то сортировка строк с конца, можно ли как-то с начала сделать?
Спасибо.





 

Поделиться сообщением


Ссылка на сообщение
2 часа назад, Dementei сказал:

@Wiltonicol Доброе утро.

А можно как-то сохранить настройки для перевода?

Ввел в исключение #*
А мне все равно все строки перевело с #.

Также создается json файл со своим форматированием, а у меня был обычный txt. Результат надо потом самому обработать, чтобы получить нужное форматирование? Также в  json пропали все пустые переносы строк.
{7647}{}{Ооо, моя нога} # target hit in left leg
# target hit in left leg

Вот чтобы не трогал текст в таких случаях с #, какое исключение надо прописать?

Что такое маска пути?

В глоссарии должен быть просто текст Английский термин пробел Русский термин?
Можно ли указать еще как минимум пол персонажа?

Где можно посмотреть пример промта для перевода?

У меня сейчас месячный пробный Gemini, когда подписка закончится, то будут по API доступны flash и pro модели? Какую из трех моделей Гмини ты советуешь использовать?

И я так понял только у Гугла API бесплатное,  у ЧАТ ГПТ и ДИПСИКА платное. Так?

Когда запускается приложение, то сортировка строк с конца, можно ли как-то с начала сделать?
Спасибо.





 

Развернуто на всё ответил в ЛС

Поделиться сообщением


Ссылка на сообщение

@Wiltonicol Спасибо.
Промежуточный (не всего файла) перевод можно интегрировать?
Чтобы проверить как это будет выглядеть.

Лимит токенов и строк. Так что главнее? Не понятно…

Так же, я как понимаю, такими кусками будет отправляться  текст на перевод. А у Гмини есть же предел какой-то, тем более на бесплатное API? Сейчас можно остановить перевод кнопкой и продолжить его если включена галка “Пропускать уже переведенные”. Так?

И самое главное, Глоссарий это хорошо, но как быть с одинаковыми предложениями, которых в тексте может быть много. Они переведутся по разному?

 

 

Поделиться сообщением


Ссылка на сообщение

@Dementei 

15 минут назад, Dementei сказал:

Лимит токенов и строк. Так что главнее? Не понятно…

Если заданное количество строк не влезет в лимит токенов, то строк отправиться меньше.

А если лимит токенов задан с запасом, то строк всё равно отправиться заданное количество. Лимит токенов не только для строк, он охватывает также промт и глоссарий.

Пол персонажей можете прописывать в самом промте.

15 минут назад, Dementei сказал:

Сейчас можно остановить перевод кнопкой и продолжить его если включена галка “Пропускать уже переведенные”.

Да, если не нажата, то пойдёт по кругу.

15 минут назад, Dementei сказал:

И самое главное, Глоссарий это хорошо, но как быть с одинаковыми предложениями, которых в тексте может быть много. Они переведутся по разному?

Через апи здесь новая отправка это грубо говоря новый чат через гемини, так что да, если в промте не отображены эти одинаковые предложения, то они могут быть переведены по разному с каждым новым чанком. В теории можно сделать через апи аналог чата, то память потребляет токены и когда условно(в бесплатном режиме) вы преодолеваете 200-300к токенов может начать делать критические ошибки. Одинаковые предложения вы можете вытащить из своего файла и перевести отдельно. Вообще для перевода желательно уметь быстро писать скрипты на том же питоне под разные задачи, ии в помощь.

3 часа назад, Dementei сказал:

У меня сейчас месячный пробный Gemini,

Если какой-нибудь премиум или про, то может лучше перевести через вэбчат, он более гибкий, ему можно скармливать в теории большие тексты(если у вас про/премиум) и в пределах чата он должен одинаково переводить.

Изменено пользователем allodernat

Поделиться сообщением


Ссылка на сообщение

@Wiltonicol 
Интересно пока через API.
Т.е. если очень большой Глоссарий и Промт, но он может не влезть в лимиты? Т.е. с каждым новым чанком отправляется и Промт и Глоссарий?

А с бесплатным ключем правда доступны 2,5 pro, 2,5 flash, 2,5 flash lite? Или это названия в интерфейсе, а на самом деле другие какие ИИ используются?

Одинаковые предложения можно найти заранее в файле и составить их список и место и отправлять один раз… как-то так.




 

Поделиться сообщением


Ссылка на сообщение
36 минут назад, Dementei сказал:

Т.е. если очень большой Глоссарий и Промт, но он может не влезть в лимиты? Т.е. с каждым новым чанком отправляется и Промт и Глоссарий?

Скажем у вас промт 4к токенов, ограничение 5к токенов, строк поставили 300. Из них к примеру отправится только 50 строк.

36 минут назад, Dementei сказал:

А с бесплатным ключем правда доступны 2,5 pro, 2,5 flash, 2,5 flash lite? Или это названия в интерфейсе, а на самом деле другие какие ИИ используются?

Доступны, кроме про, он более лимитирован. Сколько-то вы конечно обработаете, но потом он вам выдаст, что суточный лимит истёк приходите завтра.

36 минут назад, Dementei сказал:

Одинаковые предложения можно найти заранее в файле и составить их список и место и отправлять один раз… как-то так.

Если они одинаковые, достаточно отправить одно предложение а дальше cntrlC/cntrlV))

Изменено пользователем allodernat

Поделиться сообщением


Ссылка на сообщение

@allodernat Спасибо.
 

@Wiltonicol А как реализована работа с Глоссарием?
Мне Гемини говорит, что не умеет работать с Глоссарием по API.
Он вставляется в Промт каждый раз?

 

Поделиться сообщением


Ссылка на сообщение
15 минут назад, Dementei сказал:

@allodernat Спасибо.
 

@Wiltonicol А как реализована работа с Глоссарием?
Мне Гемини говорит, что не умеет работать с Глоссарием по API.
Он вставляется в Промт каждый раз?

 

Да, встраивается в запрос (промпт)

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас



Zone of Games © 2003–2025 | Реклама на сайте.

×