AwsomeEpicCool
Пользователи-
Публикации
176 -
Зарегистрирован
-
Посещение
Все публикации пользователя AwsomeEpicCool
-
Как сказали выше осталось около 10%, все очень сильно заняты, несколько человек даже делали все ночью. Всё это около 2000 пар файлов большинство из которых около полутра секунд (среди которых немало весьма противных звуков). Полный перебор потребовал бы проверки 2000 во второй степени, что составляет 4 000 000 пар для проверки или 1700 человекочасов, но на самом деле работы меньше: после каждого найденного соответствия проверять нужно менше, что при полном переборе в среднем будет находится пара за половину списка, и полный перебор не нужен, если упорядочить по продолжительности (я сделал таой список, но думаю, пока он не нужен) , то пара находится всреднем за 30 проверок, что около 60 000 проверок пар или 25 человекочасов. Может, вместо осциллограммы сделаем спектрограмму и сравним по ней? Благо, исходники в интернете есть...
-
1. можно обработать для анализа оставшиеся треки при помощи Adobe Audition, извлекая из аудио только голос; 2. можно "замедлить" (растянуть) треки; 3. можно использовать ключь -hotspot для ускорения работы JVM (например, в Phelix.vmoptions); 4. в меню settings, number of threds можно настроить количество потоков (многоядерных процессоров) для кодека аудио и\или "сравнивателя"; 5. вроде, на сравнении положительно сказывается, наоборот - увеличение битрейта или иного параметра, увиличевощего размер файла. http://rghost.ru/58510309
-
несовпадений нет Предварительный результат сопоставления http://rghost.ru/584936342 785 пар файлов (одна пара несовпадений была ошибочно внесенна повторно и не замечена проверяющими, исключил ее)
-
nik1967, напиши какие опции использовал и как искал столь эффективно, как над файлами издевался. (думаю, это полезная инф-а)
-
плейлисы совпадений 7z http://rghost.ru/58465410 плейлисы совпадений zip http://rghost.ru/58465591 плейлисы совпадений mpcpl http://rghost.ru/58465637 UPD playlist18 несовпадений нет; playlist19 несовпдений нет; playlist20 несовпдений нет; playlist21 несовпдений нет; playlist22 несовпдений нет; playlist23 несовпдений нет. Итого в списке совпадения9 несовпадений не обнаружил.
-
для рандомной сортировки
-
хентайная игрушка... думаю, простой ссылки на стиам с описанием хватит :) а ты его прекрепи сначала... и посмотри F22.4-5. наверху
-
В playlist14,playlist15,playlist16,playlist17, а соответственно и в совпадения6.mpcpl несовпадений нет.
-
плейлисты 7z http://rghost.ru/58405799плейлисты zip http://rghost.ru/58405854 __________________________________
-
не успеваю остальное сами http://rghost.ru/58393654
-
Проверил playlist9 0 несоответствий
-
плейлисты http://rghost.ru/58387647 Проверил и перепроверил playlist5 0 несоответствий
-
File10175 - поставил на приветствие windows :)
-
а шут его знает, этот вопрос стоит задть spider919191, он ресурсы распаковывал, а пока нужно проверить до конца.
-
Siberian GRemlin , так проще и эксперементировать быстрей. в теории в случае с png можно просто число для кадой из строк читать из файла, ни чего особо не ситая (кроме смещений). ну, мне так проще... Donatello7 и Kurtin вот вам еще: http://rghost.ru/58379857 это отсюда взято
-
nik1967, безумная мысль пришла мне в голову, но уже не успею ее провереить, буду ночью... По шагам: - пакетной обработкой повернуть все картинки с осциллограммами и сохранить их в png или bmp; - извлечь из структуры файлов построчно длинну пикселей одного цвета; - сравнить полученные результаты метоом нечеткого поиска текста...
-
еще 3 плейлиста на твою порцию совпадений, Упс, была ошибка (случайно были объеденены playlist2 и playlist3), ниже исправленный вариант (заодно сделал нумерацию с 4 по 6): http://rghost.ru/58379857
-
Ну да, а еще их можно поделить пополам... http://rghost.ru/58379106
-
и где этот лог? UP
-
основной класс Phelix`а это MatcherApplication, что дословно "приложение сравнения", а основные операции с аудио производятся при помощи разных метрик в AudioDNA, в частности с помоью FFT-алгоритма. В связи с чем вопрос, есть спецы по java? сможете с использованием дебагера найти переменную (строку) с результатом работы программы и скомпилировать ее с функцией выдачи результата в лог?
-
вроде давно что-то похожое, только про спецназ было?
-
ах, да... в foobar можно удалить по списку или любым нормальным плеером, а еще их можно легко преобразовать в любой формат плейлиста... да, и там уже есть нужные файлы, только в mp3 А кто? блокнот,правка,заменить... табличный редактор... скрипт... еще какой-то текстовый редактор был с такой функцией для веб-разработчиков... да, я уже подобрал разными способами и выложил вместе с сокращенным количеством звуков в mp3, см. коммент. выше. По поводу извлечения логов, выше писали, что есть ahk скрипт...
-
нашел что-то не интересное, но может кого заинтересует http://aerotwist.com/lab/music-dna/
-
Вскрытие архивов
AwsomeEpicCool ответил в тему пользователя wower1player в Вскрытие игровых ресурсов
Если у тебя один ресурс файл на все, то он как минимум упакован и было бы невероятным увидить что-то типа resource.tar поэтому такой файл наверняка запакован. Еще можно проверить энтропию файла и убедится в наличии архивации. Не редко файлы сначала архивируются каким-то методом, а потом архивы пакуются в один файл, тогда этот файл содержит в себе как минимум архивы и информацию о смещении до каждого. Бывают еще непрерывные архивы, когда файлы сначала упаковывают, а полученный пакет уже архивируют, тогда его структура зависит от алгоритма сжатия и может быть весьма неоднозначной, чтобы с ходу определить размер атома такого архива, либо размер ключа зашифрованной последователности стоит определить уровень негэнтропии для подпоследовательностей разных размеров и ориентироватся на те, которые кратны 8 битам, потомучто в программах почти всегда (ну, или всегда) пользуются байтами. Еще для того, чтобы читать структуру файла необходима знать и понимать типы данных, тех-что в С++ впринципе почти всегда достаточно. посмотреть список вызываемых модулей вы можете с помощью process explorer или аналогов (существуют с открытыми исходниками). их назначение определить по их интырфейсам (при знании английского, практик хорошего кода и распространненых имен переменных, например ptr - это указатель) или найдя в интернете имя соответствующего модуля можно найти тамже его сайт или описание его назначения. Также в файле можно встретить сигнатуры - заголовок (если он есть) нередко начинается с четырех символьной сигнатуры (метаданные определяющие тип файла), либо другие повторяющиеся четырех символьные сигнатуры. Также можно встретить трехсимвольные сигнатуры состоящие из заглавных англ. букв в ASCII. Найти соответствие сигнатур можно в интернете, поисковики часто ссылаются на БД сигнатур, можно в спецификациях файлов найти описание их структуры и используемые сигнатуры или наткнутся на них в логах (например отчетах об ошибках, которые выкладывают при креше программ или варингах компиляции, которые выкладывают программисты в случае ошибок в коде, с которыми сами не справились)... Также описание игровых форматов можно найти на http://xentax.com (создали сайт двое сценери из сообщества демо сцены, занимающиеся разбором игровых ресурсов очень давно). Возможны способы сложнее. -
https://yadi.sk/d/LwHBuEfMbnnkD уже убраны пары с ноты, кроме той, что описал выше